ایده این پروژه هم واقعا جالبه: مدلهای زبانی بزرگی که یادگیریشون فقط و فقط بر اساس متون پیش از ۱۹۱۳ بوده. این در دانشگاه زوریخ ساخته شده و کاربردش اینه که اجازه بده شما با یه آدم بسیار کتابخونده، روزنامه خونده، با سواد و آگاه سال ۱۹۱۳ گپ بزنین و از افکار و دیدگاههاش و درکش از مفاهیم عمیقا آشنا بشین. مطمئن چیزهایی مثل فاشیسم، حقوق زنان، اقتصاد و بسیاری از مفاهیم دیگه از دید این آدم کاملا متفاوت است با چیزی که ما الان درک میکنیم.
سه نکته رو هم یادآوری کنم:
- این مدل احتمالا حرفهایی میزنه که با استانداردهای امروز مشکلات متنوعی دارن
- این لینک فقط مدلها هستن، باید با روشهای مختلف مدل رو استفاده کنین؛ مثلا با اولاما که قبلا معرفی کرده ام (ollama)
- به چت ژپتو و بقیه نمیتونین بگین «با عقایده فلان سال جواب بده یا فکر کن در فلان سالی» چون ته ماجرا رو میدونه به هرحال و دقیقا مثل یک آدم اون زمان فکر نخواهد کرد.
- وقتی میگیم «درست کردن آرشیو چه فایده ای دراه؟» یکیش همینه. بودن این متون به شکل دیجیتال اجازه داده چنین پروژه ای پیش بره
- نمونههای ایرانی هم میتونن جالب باشن. هم حجم کمتری داره و عملیتر است و هم راهگشا میشه برای قدم های بعدی. فرض کنین بتونیم با کسی که در دوران انقلاب یا مشروطه است صحبت کنیم.
- اره بیشتر از سه تا شد ولی چه اشکالی داره؟
پروژه مدلهای زبانی پیش از ۱۹۱۳ رو اینجا پیدا کنین و شیوه استفاده از اولاما رو اینجا.