<div dir="ltr"><div dir="auto" style="line-break:after-white-space"><div>Hi,<br><br><br>Following the December discussions on distillation, I&#39;ve updated MG-BY-SA to address the \u201cDistillation&quot; issue we talked about. Sharing it here in case it&#39;s useful for the conversation.<br><br>The main change: <br>I now distinguish between direct model modifications (Derivative Materials) and models created by distilling output (Extracted Models). Both need to stay under MG-BY-SA, but Extracted Models require a notice saying they came from a model under this license.<br><br>Why I think this matters: <br>We&#39;ve seen cases like Cursor building Composer 2 on Kimi K2.5 without disclosure, and the broader distillation concerns from OpenAI/Anthropic. Lots of Hugging Face datasets don&#39;t mention which model generated them, then get used to train models under different licenses.<br><br>I know this doesn&#39;t fit the OSD, but it might be useful for model developers who want to keep derivatives open even when they&#39;re created through extraction.<br><br>Curious to hear your thoughts.<br><br><br>Moming Duan<br><br><br><br><br><blockquote type="cite">On Dec 29, 2025, at 09:32, Josh Berkus &lt;<a href="mailto:josh@berkus.org" target="_blank">josh@berkus.org</a>&gt; wrote:<br><br>On 12/15/25 9:19 AM, Moming Duan wrote:<br><blockquote type="cite">That said, I remain focused on this issue and will continue to explore whether there is a valid case for MG-BY-SA as a proprietary model license rather than an open source one. My concern is that, in the worst case, large-scale distillation could reduce the willingness of organizations to release open models such as Qwen (under Apache-2.0), pushing them instead toward proprietary service agreements that explicitly prohibit behaviors like distillation. The reverse is also possible, as some models, like DeepSeek and Qwen, have relicensed from custom licenses to OSI-approved licenses.<br></blockquote><br>Please do!  This is a very important question for the OSS licensing of models.  It may turn out that it&#39;s impossible because of the limitations of copyright on model output, but if so, let&#39;s figure that out definitively.<br><br>-- <br>Josh Berkus<br></blockquote><br></div></div></div>