مدل‌های زبانی سال‌های گذشته: با آدمی بسیار کتابخونده و آگاه از زمانه اما از سال ۱۹۱۳ گپ بزنین

ایده این پروژه هم واقعا جالبه: مدل‌های زبانی بزرگی که یادگیری‌شون فقط و فقط بر اساس متون پیش از ۱۹۱۳ بوده. این در دانشگاه زوریخ ساخته شده و کاربردش اینه که اجازه بده شما با یه آدم بسیار کتابخونده، روزنامه خونده، با سواد و آگاه سال ۱۹۱۳ گپ بزنین و از افکار و دیدگاه‌هاش و درکش از مفاهیم عمیقا آشنا بشین. مطمئن چیزهایی مثل فاشیسم، حقوق زنان، اقتصاد و بسیاری از مفاهیم دیگه از دید این آدم کاملا متفاوت است با چیزی که ما الان درک می‌کنیم.

سه نکته رو هم یادآوری کنم:

  1. این مدل احتمالا حرف‌هایی می‌زنه که با استانداردهای امروز مشکلات متنوعی دارن
  2. این لینک فقط مدل‌ها هستن، باید با روش‌های مختلف مدل رو استفاده کنین؛ مثلا با اولاما که قبلا معرفی کرده ام (ollama)
  3. به چت ژپتو و بقیه نمی‌تونین بگین «با عقایده فلان سال جواب بده یا فکر کن در فلان سالی» چون ته ماجرا رو می‌دونه به هرحال و دقیقا مثل یک آدم اون زمان فکر نخواهد کرد.
  4. وقتی میگیم «درست کردن آرشیو چه فایده ای دراه؟» یکیش همینه. بودن این متون به شکل دیجیتال اجازه داده چنین پروژه ای پیش بره
  5. نمونه‌های ایرانی هم می‌تونن جالب باشن. هم حجم کمتری داره و عملی‌تر است و هم راهگشا می‌شه برای قدم های بعدی. فرض کنین بتونیم با کسی که در دوران انقلاب یا مشروطه است صحبت کنیم.
  6. اره بیشتر از سه تا شد ولی چه اشکالی داره؟

پروژه مدل‌های زبانی پیش از ۱۹۱۳ رو اینجا پیدا کنین و شیوه استفاده از اولاما رو اینجا.