<div dir="ltr"><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">On Fri, Feb 14, 2025 at 3:57 AM Eric Schultz <<a href="mailto:eric@wwahammy.com">eric@wwahammy.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="font-family:Arial,sans-serif;font-size:14px">PS: While the Open Source AI definition says you don't have to include the source data to be an "Open Source AI", I would disagree with that conclusion. But that's my own two cents.<br></div></blockquote><div><br></div><div><div style="font-size:small" class="gmail_default">This is a common misunderstanding that I'd like to correct for the records. If you read carefully, the OSAID clearly states that the training data *is* required. That's what these sentences in the Definition mean:</div><div style="font-size:small" class="gmail_default"><br></div><div style="font-size:small;margin-left:40px" class="gmail_default">"Sufficiently detailed information about the data used to train the 
system so that a skilled person can build a substantially equivalent 
system." and </div><div style="font-size:small;margin-left:40px" class="gmail_default">"The Code shall represent the full specification of how the data was processed and filtered, and how the training was done."</div><div style="font-size:small" class="gmail_default"><br></div><div style="font-size:small" class="gmail_default">In hindsight, could the text have been more clear? We tried to draft a text that would cover  all kinds of machine learning systems, not just LLMs. We'll fix the text in later versions.</div><div style="font-size:small" class="gmail_default"><br></div><div style="font-size:small" class="gmail_default">The FAQ has more details, you may start from here: <a href="https://opensource.org/ai/faq#what-kind-of-data-should-be-required-in-the-open-source-ai-definition">https://opensource.org/ai/faq#what-kind-of-data-should-be-required-in-the-open-source-ai-definition</a></div><div style="font-size:small" class="gmail_default"><br></div><div style="font-size:small" class="gmail_default">/stef</div><div style="font-size:small" class="gmail_default"><br></div><div style="font-size:small" class="gmail_default">PS this conversation is off-topic for this list. Please continue it on <a href="https://discuss.opensource.org">https://discuss.opensource.org</a>, if you're interested.</div><br></div></div></div>