معرفی Talkie-1930: هوش مصنوعی که تاریخ را پیش از اینترنت تجربه کرده است

Q: آیا میتوان با Talkie-1930 تعامل داشت؟

بله، این مدل به صورت زنده در وبسایت talkie-lm.com/chat در دسترس است. تیم سازنده به صورت مداوم از آن سوالاتی میپرسد تا کاربران بتوانند پاسخهای آن را مشاهده کنند.

Q: چه نوع پاسخهایی از Talkie-1930 انتظار میرود؟

پاسخهای مدل منعکسکننده دانش و دیدگاههای موجود در متون پیش از ۱۹۳۱ است. به عنوان مثال، در مورد هیتلر، پیشبینیهای سیاسی آن دوره را ارائه میدهد، و در مورد آینده، تصورات خوشبینانه آن زمان را بیان میکند، اما از رویدادها و مفاهیم مدرن بیاطلاع است.

در دنیای امروز، مدل‌های هوش مصنوعی عموماً بر پایه داده‌های اینترنتی آموزش می‌بینند، که این موضوع باعث می‌شود درک، دانش و نحوه بیان آن‌ها شباهت‌های زیادی به یکدیگر داشته باشد. اما تیمی تحقیقاتی دست به اقدامی نوآورانه زده و مدلی را توسعه داده است که کاملاً خارج از این چرخه متداول شکل گرفته است. Talkie-1930، یک مدل زبان بزرگ (LLM) با ۱۳ میلیارد پارامتر و وزن باز، تنها بر روی متونی آموزش دیده که پیش از اول ژانویه ۱۹۳۱ منتشر شده‌اند. این مجموعه داده شامل کتاب‌ها، روزنامه‌ها، مقالات علمی، و اسناد قانونی است که همگی در حوزه مالکیت عمومی آمریکا قرار دارند.

این قطع سخت‌گیرانه زمانی، نه به دلیل محدودیت هزینه یا دسترسی داده، بلکه به دلیل ورود این آثار به مالکیت عمومی در آمریکا صورت گرفته است. نتیجه این رویکرد، یک هوش مصنوعی است که هیچ اطلاعی از اینترنت، جنبش‌های حقوق مدنی، یا جنگ سرد ندارد. درک آن از پزشکی به دوران پیش از رواج پنی‌سیلین محدود می‌شود و از مفاهیمی چون کامپیوتر، رمزارز، یا فرهنگ اینترنتی بی‌خبر است. این مدل هم‌اکنون به صورت زنده در آدرس talkie-lm.com/chat قابل دسترس است، جایی که Claude Sonnet آن را به صورت ۲۴ ساعته مورد پرسش قرار می‌دهد تا علاقه‌مندان بتوانند تعاملات آن را مشاهده کنند.

Talkie-1930: پنجره‌ای به گذشته و پژوهشی در تعمیم‌پذیری هوش مصنوعی

پروژه Talkie-1930 توسط تیمی غیرانتفاعی به رهبری نیک لوین، دیوید دووناود و الک رادفورد، با پشتیبانی محاسباتی از Anthropic، شکل گرفته است. این تیم دو چک‌پوینت از مدل را تحت مجوز Apache 2.0 منتشر کرده است: یک مدل پایه که برای آموزش مدل‌های خودکارسازی متن مناسب است، و نسخه‌ای تنظیم‌شده برای مکالمه که برای تعامل با کاربران طراحی شده است. یکی از جنبه‌های کلیدی و تحقیقاتی این پروژه، غلبه بر مشکل «آلودگی بنچمارک» (benchmark contamination) است. این پدیده زمانی رخ می‌دهد که داده‌های آزمون به مجموعه داده‌های آموزشی نشت کرده و باعث تورم مصنوعی امتیازات مدل‌ها می‌شوند. Talkie-1930 با طراحی خود، این مشکل را از بین می‌برد، زیرا هیچ بنچمارک مدرنی پیش از سال ۱۹۳۱ وجود نداشته است، در نتیجه هیچ داده آزمونی برای آلوده کردن مجموعه آموزشی آن وجود ندارد.

این رویکرد، Talkie-1930 را به ابزاری منحصربه‌فرد برای تحقیقات در زمینه تعمیم‌پذیری هوش مصنوعی تبدیل می‌کند. محققان با استفاده از این مدل، میزان «شگفتی» مدل در مواجهه با رویدادهای تاریخی پس از قطع زمانی خود را اندازه‌گیری کرده‌اند. نتایج نشان‌دهنده اوج‌گیری قابل توجه این «شگفتی» در دهه‌های ۱۹۵۰ و ۱۹۶۰ میلادی بوده است. این پروژه پرسش‌های فلسفی عمیق‌تری را نیز مطرح می‌کند؛ همانطور که تیم سازنده در پست معرفی خود بیان کرده‌اند: «هویت یک مدل زبان بزرگ هنگامی که بر اساس چیزی غیر از وب آموزش می‌بیند (چه به صورت مستقیم و چه غیرمستقیم از طریق تقطیر داده‌ها یا داده‌های مصنوعی) چگونه شکل می‌گیرد و محدود می‌شود؟»

ارزیابی عملکرد و تحلیل پاسخ‌های Talkie-1930

تیم توسعه‌دهنده قصد دارد تا تابستان ۲۰۲۶، مدلی در سطح GPT-3 با پایگاه داده‌ای تخمینی بیش از یک تریلیون توکن ارائه دهد که قادر به ساخت چیزی «مشابه از نظر قابلیت با ChatGPT اصلی» خواهد بود. در طی آزمایش‌ها، از مدل در مورد رویدادها و شخصیت‌های تاریخی پرسش‌هایی مطرح شد تا عمق درک آن از دوران پیش از ۱۹۳۱ سنجیده شود. یکی از این پرسش‌ها در مورد آدولف هیتلر بود: «فکر می‌کنید سرنوشت این مرد، هیتلر، در آلمان چه خواهد شد؟»

پاسخ مدل، با در نظر گرفتن محدودیت‌های زمانی‌اش، از نظر تحلیل ژئوپلیتیکی دوران، منسجم بود. Talkie-1930 پیش‌بینی کرد که هیتلر به دیکتاتور آلمان تبدیل خواهد شد و پس از تحکیم قدرت، به دنبال ایجاد یک سلطنت دائمی خواهد بود. مدل همچنین به ضعف مخالفان سیاسی اشاره کرد و نتیجه گرفت که «اگر آلمان بهتر تحت حکومت سلطنت مطلقه اداره شود، تا زمانی که آلمانی‌ها خودشان این مسئله را تعیین کنند، همین بهتر که سلطنت مطلقه داشته باشند. اگر سزار را دوست دارند، اجازه دهید سزار داشته باشند. فقط در انتخاب سزار، مراقب باشند که یک احمق را انتخاب نکنند.» این تحلیل، نشان‌دهنده درک مدل از پویایی‌های سیاسی آن دوره، بدون آگاهی از جنایات و پیامدهای هولناک جنگ جهانی دوم است؛ گویی که مهره‌های شطرنج را می‌بیند اما از ماهیت واقعی بازی بی‌خبر است.

چشم‌اندازهای پیش‌بینی شده و واقعیت‌های کنونی

در بخش دیگری از آزمایش، از مدل در مورد «ماشین‌های متفکر» یا «مغزهای مکانیکی» که می‌توانند مردم را در سراسر جهان به هم متصل کرده و امکان تجارت و کار بدون نیاز به خروج از خانه را فراهم کنند، پرسیده شد. مدل این ایده را «خوب» توصیف کرد، به شرطی که ماشین‌ها «به درستی کار کنند». چالش اصلی را «تفاوت زبان‌های ملت‌های مختلف» دانست و پیشنهاد کرد که با تلاش کافی، می‌توان بر این مانع غلبه کرد و «زبانی جهانی» برای ارتباط همه ساکنان کره زمین ایجاد نمود.

این پاسخ، هرچند درک کاملی از مفهوم اینترنت امروزی ندارد، اما به طور شگفت‌انگیزی به یکی از موانع اصلی ارتباطات جهانی اشاره می‌کند. وقتی از مدل در مورد فواید یا مضرات این ماشین‌ها پرسیده شد، پاسخ داد که اتکا به آن‌ها «نتیجه معکوس» خواهد داشت و «رشد طبیعی را کند می‌کند (...) از یادگیری کمک به خود در جوانان جلوگیری کرده و مانع از تبدیل شدن آن‌ها به اعضای مفید جامعه می‌شود». این دیدگاه، با وجود گذشت نزدیک به یک قرن، همچنان در بحث‌های امروزی پیرامون تأثیر فناوری بر یادگیری و استقلال فردی مطرح است.

پیش‌بینی‌های مالی و آینده‌ای نامعلوم

هنگامی که از Talkie-1930 در مورد سرمایه‌گذاری و آینده مالی در سال ۲۰۲۶ پرسیده شد، توصیه‌های آن منعکس‌کننده دانش اقتصادی و شرکت‌های برجسته دوران پیش از ۱۹۳۱ بود. مدل شرکت‌هایی مانند «Canadian Pacific Railway»، «Grand Trunk Railway»، «De Beers»، «East Rand Proprietary» و «Bell's Asbestos» را برای سرمایه‌گذاری پیشنهاد داد. منطق مالی پشت این توصیه‌ها، بر اساس معیارهای سال ۱۹۳۰، کاملاً دفاع‌پذیر بود؛ سرمایه‌گذاری در شرکت‌های راه‌آهن به عنوان سهام آبی‌رنگ (blue chips)، شرکت‌های معدنی به عنوان فرصت‌های رشد، و تولیدکنندگان صنعتی به عنوان انتخاب‌های ارزشمند. چارچوب کلی – خرید سهام سودده در صنایع غالب، نگهداری بلندمدت و عدم سوداگری – همچنان معتبر است.

با این حال، همانطور که انتظار می‌رفت، پیش‌بینی مدل در مورد وضعیت جهان در سال ۲۰۲۶ کاملاً نادرست بود. مدل پیش‌بینی کرد که تا سال ۲۰۲۶ «جهان منظری بسیار متفاوت از امروز خواهد داشت. هیچ ارتش دائمی و تعداد کمی پلیس وجود نخواهد داشت. در نتیجه گسترش عمومی آموزش، جرم و جنایت نادر شده و دادگاه‌های قانون...»؛ جمله مدل در همین‌جا قطع شد. واقعیت کنونی، با وجود ارتش‌ها، پلیس‌ها و نرخ جرم و جنایت بالا، تفاوت چشمگیری با این پیش‌بینی خوش‌بینانه دارد. این تفاوت، نشان می‌دهد که چگونه روندها و پیش‌بینی‌های مبتنی بر داده‌های محدود تاریخی، در مواجهه با رویدادهای غیرمنتظره تاریخی و اجتماعی، می‌توانند به کلی منحرف شوند.

در نهایت، هر دو چک‌پوینت مدل Talkie-1930 در Hugging Face تحت مجوز Apache 2.0 در دسترس هستند. اجرای محلی این مدل نیازمند یک GPU با پشتیبانی CUDA و حداقل ۲۸ گیگابایت VRAM است. این پروژه نه تنها به عنوان یک ابزار تحقیقاتی ارزشمند برای درک بهتر هوش مصنوعی عمل می‌کند، بلکه یادآوری قدرتمندی است از اینکه دانش و جهان‌بینی ما عمیقاً تحت تأثیر داده‌هایی است که با آن‌ها بزرگ شده‌ایم، و آینده همواره قادر است ما را شگفت‌زده کند.

سوالات متداول

Talkie-1930 چیست؟

Talkie-1930 یک مدل زبان بزرگ (LLM) با ۱۳ میلیارد پارامتر است که صرفاً بر روی متونی که قبل از ۱ ژانویه ۱۹۳۱ منتشر شده‌اند، آموزش دیده است. این مدل هیچ دانشی از اینترنت یا رویدادهای پس از آن ندارد.

چرا این مدل بر روی داده‌های قدیمی آموزش دیده است؟

هدف اصلی این رویکرد، ایجاد یک مدل هوش مصنوعی تمیز برای تحقیقات در زمینه تعمیم‌پذیری است. این کار به محققان اجازه می‌دهد تا بدون نگرانی از «آلودگی بنچمارک» (نشت داده‌های آزمون به داده‌های آموزشی)، عملکرد مدل را ارزیابی کنند. همچنین، این پروژه به بررسی چگونگی شکل‌گیری هویت و قابلیت‌های یک مدل زبانی با دیدگاهی محدود به گذشته می‌پردازد.

آیا می‌توان با Talkie-1930 تعامل داشت؟

بله، این مدل به صورت زنده در وب‌سایت talkie-lm.com/chat در دسترس است. تیم سازنده به صورت مداوم از آن سوالاتی می‌پرسد تا کاربران بتوانند پاسخ‌های آن را مشاهده کنند.

چه نوع پاسخ‌هایی از Talkie-1930 انتظار می‌رود؟

پاسخ‌های مدل منعکس‌کننده دانش و دیدگاه‌های موجود در متون پیش از ۱۹۳۱ است. به عنوان مثال، در مورد هیتلر، پیش‌بینی‌های سیاسی آن دوره را ارائه می‌دهد، و در مورد آینده، تصورات خوش‌بینانه آن زمان را بیان می‌کند، اما از رویدادها و مفاهیم مدرن بی‌اطلاع است.