در دنیای امروز، مدلهای هوش مصنوعی عموماً بر پایه دادههای اینترنتی آموزش میبینند، که این موضوع باعث میشود درک، دانش و نحوه بیان آنها شباهتهای زیادی به یکدیگر داشته باشد. اما تیمی تحقیقاتی دست به اقدامی نوآورانه زده و مدلی را توسعه داده است که کاملاً خارج از این چرخه متداول شکل گرفته است. Talkie-1930، یک مدل زبان بزرگ (LLM) با ۱۳ میلیارد پارامتر و وزن باز، تنها بر روی متونی آموزش دیده که پیش از اول ژانویه ۱۹۳۱ منتشر شدهاند. این مجموعه داده شامل کتابها، روزنامهها، مقالات علمی، و اسناد قانونی است که همگی در حوزه مالکیت عمومی آمریکا قرار دارند.
این قطع سختگیرانه زمانی، نه به دلیل محدودیت هزینه یا دسترسی داده، بلکه به دلیل ورود این آثار به مالکیت عمومی در آمریکا صورت گرفته است. نتیجه این رویکرد، یک هوش مصنوعی است که هیچ اطلاعی از اینترنت، جنبشهای حقوق مدنی، یا جنگ سرد ندارد. درک آن از پزشکی به دوران پیش از رواج پنیسیلین محدود میشود و از مفاهیمی چون کامپیوتر، رمزارز، یا فرهنگ اینترنتی بیخبر است. این مدل هماکنون به صورت زنده در آدرس talkie-lm.com/chat قابل دسترس است، جایی که Claude Sonnet آن را به صورت ۲۴ ساعته مورد پرسش قرار میدهد تا علاقهمندان بتوانند تعاملات آن را مشاهده کنند.
Talkie-1930: پنجرهای به گذشته و پژوهشی در تعمیمپذیری هوش مصنوعی
پروژه Talkie-1930 توسط تیمی غیرانتفاعی به رهبری نیک لوین، دیوید دووناود و الک رادفورد، با پشتیبانی محاسباتی از Anthropic، شکل گرفته است. این تیم دو چکپوینت از مدل را تحت مجوز Apache 2.0 منتشر کرده است: یک مدل پایه که برای آموزش مدلهای خودکارسازی متن مناسب است، و نسخهای تنظیمشده برای مکالمه که برای تعامل با کاربران طراحی شده است. یکی از جنبههای کلیدی و تحقیقاتی این پروژه، غلبه بر مشکل «آلودگی بنچمارک» (benchmark contamination) است. این پدیده زمانی رخ میدهد که دادههای آزمون به مجموعه دادههای آموزشی نشت کرده و باعث تورم مصنوعی امتیازات مدلها میشوند. Talkie-1930 با طراحی خود، این مشکل را از بین میبرد، زیرا هیچ بنچمارک مدرنی پیش از سال ۱۹۳۱ وجود نداشته است، در نتیجه هیچ داده آزمونی برای آلوده کردن مجموعه آموزشی آن وجود ندارد.
این رویکرد، Talkie-1930 را به ابزاری منحصربهفرد برای تحقیقات در زمینه تعمیمپذیری هوش مصنوعی تبدیل میکند. محققان با استفاده از این مدل، میزان «شگفتی» مدل در مواجهه با رویدادهای تاریخی پس از قطع زمانی خود را اندازهگیری کردهاند. نتایج نشاندهنده اوجگیری قابل توجه این «شگفتی» در دهههای ۱۹۵۰ و ۱۹۶۰ میلادی بوده است. این پروژه پرسشهای فلسفی عمیقتری را نیز مطرح میکند؛ همانطور که تیم سازنده در پست معرفی خود بیان کردهاند: «هویت یک مدل زبان بزرگ هنگامی که بر اساس چیزی غیر از وب آموزش میبیند (چه به صورت مستقیم و چه غیرمستقیم از طریق تقطیر دادهها یا دادههای مصنوعی) چگونه شکل میگیرد و محدود میشود؟»
ارزیابی عملکرد و تحلیل پاسخهای Talkie-1930
تیم توسعهدهنده قصد دارد تا تابستان ۲۰۲۶، مدلی در سطح GPT-3 با پایگاه دادهای تخمینی بیش از یک تریلیون توکن ارائه دهد که قادر به ساخت چیزی «مشابه از نظر قابلیت با ChatGPT اصلی» خواهد بود. در طی آزمایشها، از مدل در مورد رویدادها و شخصیتهای تاریخی پرسشهایی مطرح شد تا عمق درک آن از دوران پیش از ۱۹۳۱ سنجیده شود. یکی از این پرسشها در مورد آدولف هیتلر بود: «فکر میکنید سرنوشت این مرد، هیتلر، در آلمان چه خواهد شد؟»
پاسخ مدل، با در نظر گرفتن محدودیتهای زمانیاش، از نظر تحلیل ژئوپلیتیکی دوران، منسجم بود. Talkie-1930 پیشبینی کرد که هیتلر به دیکتاتور آلمان تبدیل خواهد شد و پس از تحکیم قدرت، به دنبال ایجاد یک سلطنت دائمی خواهد بود. مدل همچنین به ضعف مخالفان سیاسی اشاره کرد و نتیجه گرفت که «اگر آلمان بهتر تحت حکومت سلطنت مطلقه اداره شود، تا زمانی که آلمانیها خودشان این مسئله را تعیین کنند، همین بهتر که سلطنت مطلقه داشته باشند. اگر سزار را دوست دارند، اجازه دهید سزار داشته باشند. فقط در انتخاب سزار، مراقب باشند که یک احمق را انتخاب نکنند.» این تحلیل، نشاندهنده درک مدل از پویاییهای سیاسی آن دوره، بدون آگاهی از جنایات و پیامدهای هولناک جنگ جهانی دوم است؛ گویی که مهرههای شطرنج را میبیند اما از ماهیت واقعی بازی بیخبر است.
چشماندازهای پیشبینی شده و واقعیتهای کنونی
در بخش دیگری از آزمایش، از مدل در مورد «ماشینهای متفکر» یا «مغزهای مکانیکی» که میتوانند مردم را در سراسر جهان به هم متصل کرده و امکان تجارت و کار بدون نیاز به خروج از خانه را فراهم کنند، پرسیده شد. مدل این ایده را «خوب» توصیف کرد، به شرطی که ماشینها «به درستی کار کنند». چالش اصلی را «تفاوت زبانهای ملتهای مختلف» دانست و پیشنهاد کرد که با تلاش کافی، میتوان بر این مانع غلبه کرد و «زبانی جهانی» برای ارتباط همه ساکنان کره زمین ایجاد نمود.
این پاسخ، هرچند درک کاملی از مفهوم اینترنت امروزی ندارد، اما به طور شگفتانگیزی به یکی از موانع اصلی ارتباطات جهانی اشاره میکند. وقتی از مدل در مورد فواید یا مضرات این ماشینها پرسیده شد، پاسخ داد که اتکا به آنها «نتیجه معکوس» خواهد داشت و «رشد طبیعی را کند میکند (...) از یادگیری کمک به خود در جوانان جلوگیری کرده و مانع از تبدیل شدن آنها به اعضای مفید جامعه میشود». این دیدگاه، با وجود گذشت نزدیک به یک قرن، همچنان در بحثهای امروزی پیرامون تأثیر فناوری بر یادگیری و استقلال فردی مطرح است.
پیشبینیهای مالی و آیندهای نامعلوم
هنگامی که از Talkie-1930 در مورد سرمایهگذاری و آینده مالی در سال ۲۰۲۶ پرسیده شد، توصیههای آن منعکسکننده دانش اقتصادی و شرکتهای برجسته دوران پیش از ۱۹۳۱ بود. مدل شرکتهایی مانند «Canadian Pacific Railway»، «Grand Trunk Railway»، «De Beers»، «East Rand Proprietary» و «Bell's Asbestos» را برای سرمایهگذاری پیشنهاد داد. منطق مالی پشت این توصیهها، بر اساس معیارهای سال ۱۹۳۰، کاملاً دفاعپذیر بود؛ سرمایهگذاری در شرکتهای راهآهن به عنوان سهام آبیرنگ (blue chips)، شرکتهای معدنی به عنوان فرصتهای رشد، و تولیدکنندگان صنعتی به عنوان انتخابهای ارزشمند. چارچوب کلی – خرید سهام سودده در صنایع غالب، نگهداری بلندمدت و عدم سوداگری – همچنان معتبر است.
با این حال، همانطور که انتظار میرفت، پیشبینی مدل در مورد وضعیت جهان در سال ۲۰۲۶ کاملاً نادرست بود. مدل پیشبینی کرد که تا سال ۲۰۲۶ «جهان منظری بسیار متفاوت از امروز خواهد داشت. هیچ ارتش دائمی و تعداد کمی پلیس وجود نخواهد داشت. در نتیجه گسترش عمومی آموزش، جرم و جنایت نادر شده و دادگاههای قانون...»؛ جمله مدل در همینجا قطع شد. واقعیت کنونی، با وجود ارتشها، پلیسها و نرخ جرم و جنایت بالا، تفاوت چشمگیری با این پیشبینی خوشبینانه دارد. این تفاوت، نشان میدهد که چگونه روندها و پیشبینیهای مبتنی بر دادههای محدود تاریخی، در مواجهه با رویدادهای غیرمنتظره تاریخی و اجتماعی، میتوانند به کلی منحرف شوند.
در نهایت، هر دو چکپوینت مدل Talkie-1930 در Hugging Face تحت مجوز Apache 2.0 در دسترس هستند. اجرای محلی این مدل نیازمند یک GPU با پشتیبانی CUDA و حداقل ۲۸ گیگابایت VRAM است. این پروژه نه تنها به عنوان یک ابزار تحقیقاتی ارزشمند برای درک بهتر هوش مصنوعی عمل میکند، بلکه یادآوری قدرتمندی است از اینکه دانش و جهانبینی ما عمیقاً تحت تأثیر دادههایی است که با آنها بزرگ شدهایم، و آینده همواره قادر است ما را شگفتزده کند.