یک سال پیش، گاهی احساس میشد که هوش مصنوعی به شکلی در همه جا گسترش یافته است، اما این تنها پیشنمایشی از نحوه ورود ناگهانی هوش مصنوعی به زندگی مردم بود، چه به سود و چه به زیان.
برای پوشش دادن هر بهروزرسانی تحولآفرین، راهاندازیهای چشمگیر و اشتباهات شرمآور برندهای بزرگ هوش مصنوعی مانند ChatGPT از OpenAI، Google Gemini و Apple Intelligence، نیاز به یک مجموعه کتاب کامل است، چه برسد به هر توسعهدهنده هوش مصنوعی دیگر.
با این حال، هنوز نکات کلیدی وجود دارند که پیش از اینکه در سال ۲۰۲۵ دوباره چشمانداز را دگرگون کند، ارزش یادآوری دارند.
در ماه مه، معرفی مدل GPT-4o، که به دنبال آن نسخه سبکتر GPT-4o منتشر شد، آغازگر تکامل چندوجهی ChatGPT در پردازش متن، تصویر، صدا و ویدیو بود. انتشار مدل o1 در دسامبر، سطح جدیدی از استدلال را به ارمغان آورد، با پاسخهای تیزتر و بصیرتر. این مدل ثابت کرد که ابزاری بیقیمت برای همه چیز از چالشهای کدنویسی گرفته تا طوفان فکری خلاقانه است.
حالت صدای پیشرفته ChatGPT تعاملات صوتی جدیدی را با طیفی از صداهای واقعگرایانه – از جمله صدای بابا نوئل – به ChatGPT اضافه کرد. اگر از طریق اپلیکیشن صحبت نمیکردید، OpenAI حتی خط تلفن رایگان 1-800-CHATGPT را راهاندازی کرده بود تا بتوانید با ChatGPT تماس بگیرید و تعامل کنید.
سینماگران بیشتر سال را با اشتیاق به انتظار مدل متنی به ویدیو سورا از OpenAI گذراندند. در حالی که این مدل به تازگی برای سینماگران غیرحرفهای در دسترس قرار گرفته است، توانایی سورا در ساخت ویدیوهای انیمیشنی اکنون برای ذهنهای خلاق یا بازاریابهایی که در موعد مقرر قرار دارند، قابل دسترسی است.
همکاری خلاقانه همچنین محور حالت Canvas ChatGPT بود، که امکان همکاری در زمان واقعی با هوش مصنوعی را فراهم میکند و به کاربران این امکان را میدهد که پروژهها را بهطور مشترک و همزمان ویرایش و بهبود دهند. برای حفظ نظم، OpenAI همچنین ویژگی Projects را معرفی کرد که گفتگوها و فایلها را در پوشههای مرتب گروهبندی میکند. علاوه بر این، قابلیت جستجوی گسترشیافته ChatGPT به کمک میآید تا تمامی اطلاعات بهروز و دقیق بمانند.
برای تکمیل همه اینها، OpenAI سال را با رویداد جشنوارهای "۱۲ روز OpenAI" به پایان رساند که بهروزرسانیهای روزانه مانند ادغام WhatsApp، سطح جدید ChatGPT Pro با قیمت ۲۰۰ دلار در ماه، و پیشنمایشی از مدل O3 برای چتبات را معرفی کرد. این اقدامات احتمالاً به پراکندگی توجه از قطعی طولانی در دسامبر ناشی از خرابی مرکز دادههای مایکروسافت کمک کرد. گستردگی این اختلال شاید در بازاریابی عمومی تاثیر خوبی نداشت، اما بهطور غیرقابل انکاری نشان داد که ChatGPT از آغاز سال ۲۰۲۴ چقدر گسترش یافته است.
جهش Google Gemini
تا پایان سال ۲۰۲۴، Google Gemini حتی وجود نداشت. تنها در ماه فوریه بود که Bard به Gemini تبدیل شد و این تغییر برند بخشی از تلاش یکساله گوگل برای پیشی گرفتن از OpenAI بود که هوش مصنوعی را به تمامی جنبههای خدمات خود وارد میکرد. یک اپلیکیشن جدید و براق Gemini برای اندروید و یک سطح اشتراک Gemini Advanced بلافاصله رقابت با ChatGPT را آغاز کردند و بهروزرسانیها نیز بهدنبال آن آمدند.
تا ماه مه، گوگل نسخه بهروزرسانیشده Gemini 1.5 را منتشر کرد، که شامل قدرت پردازش بیشتر و پنجره زمینه گسترشیافته بود، که این آن را هوشمندتر و توانمندتر در درک درخواستهای پیچیده میساخت. اما جادو واقعی در تابستان آغاز شد، زمانی که هوش Gemini به دستگاههای Google Home وارد شد و جایگزین Google Assistant در بسیاری از مکانها شد.
این تحولات در سپتامبر با Gemini Live به اوج رسید، ویژگیای که به شما امکان گفتوگوهای صوتی در زمان واقعی با هوش مصنوعی را میدهد. رقابت با ChatGPT با رباتهای چت سفارشی به نام Gems ادامه یافت و یک ماه بعد، اپلیکیشن iPhone با یکپارچهسازی در سایر اپلیکیشنهای گوگل بر روی iOS منتشر شد.
فینال بزرگ در دسامبر با انتشار Gemini 2.0 بود، یک بهروزرسانی عظیم که پاسخهای سریعتر و بهتر، تحلیل تصاویر و ویژگیهای بیشتر را به همراه داشت. بهعلاوه، ویژگیهای انحصاری برای تلفنهای Google Pixel که ارتباط بیشتری با سایر بخشهای اکوسیستم گوگل ایجاد میکرد.
هوش مصنوعی اپل سرانجام به بلوغ میرسد
شایعات در مورد برنامههای اپل برای هوش مصنوعی سالها بود که منتشر میشد، اما در سال ۲۰۲۴ بود که Apple Intelligence بالاخره رونمایی شد. این ابتکار هم اجتنابناپذیر به نظر میرسید و هم بهطور خاص برای اپل در معرفی خود در WWDC ماه ژوئن ویژگیهایی داشت.
طراحی آن کاملاً اپلی بود، اما مقدار قابل توجهی از ادغام با مدلهای هوش مصنوعی موجود مشاهده میشد. بهویژه، اپل به دستیار صوتی Siri جدیدش این امکان را میدهد که برای پاسخها و درخواستهای مختلف به ChatGPT اتکا کند. ما هنوز منتظر قابلیتهای promised Siri برای مشاهده، درک و انجام وظایف درون برنامهها هستیم.
با وجود برندینگ متفاوت، ابزارهای هوش مصنوعی اپل بیشتر به نظر میرسید که هدفشان همسطح شدن یا پیشی گرفتن از ویژگیهای موجود در OpenAI و گوگل باشد. به عنوان مثال، Apple Intelligence قدرتدهنده به ابزار ایجاد تصویر Image Playground است، و همچنین Genmoji که به کاربران اجازه میدهد تا ایموجیهای خود را طراحی کنند.
ممکن است بارزترین جنبه این باشد که Apple Intelligence بیشتر از سختافزارهای اپل برای انجام فرآیندهای هوش مصنوعی بهطور محلی یا بر روی سرورهای بسیار امن Private Cloud Compute استفاده میکند. به این ترتیب، Apple Intelligence میتواند سریعتر عمل کند و حریم خصوصی بیشتری را وعده دهد.
متا و صعود و سقوط سختافزار
در حالی که OpenAI، گوگل و اپل در صدر خبرها بودند، هوش مصنوعی تأثیر بسیار وسیعتری داشت که ناشی از برندهای بزرگ دیگری بود. بهعنوان مثال، متا دستیار مجازی Meta AI را معرفی کرد و آن را در فیسبوک، اینستاگرام و واتساپ جاسازی کرد و قابلیتهای آن را (شامل برخی از صداهای سلبریتیها) throughout سال بهروزرسانی و گسترش داد. همچنین متا اعلام کرد که سال آینده سال عینکهای هوشمند AI خواهد بود، زیرا Meta AI را در هدستهای Meta Quest و عینکهای هوشمند Meta Ray-Ban جاسازی کرده است. و هیچکس نمیتواند رونمایی از نمونه اولیه عینکهای واقعیت افزوده Orion را فراموش کند.
با این حال، تمام سختافزارهای هوش مصنوعی امسال بهخوبی عمل نکردند. هیجان زیادی پیرامون محصولاتی مانند Rabbit R1، یک دستگاه کوچک متمرکز بر هوش مصنوعی، و پوشیدنیهایی مانند Humane AI Pin و Plaud NotePin در آغاز سال وجود داشت، اما این محصولات به سرعت کمرنگ شدند و احتمالاً تنها به عنوان محصولات خاص با کاربرد محدود موفق خواهند شد.
اگر ۲۰۲۴ چیزی ثابت کرده باشد، این است که هوش مصنوعی رسماً از فاز تکنولوژی جدید و درخشان خود عبور کرده و به یک انقلاب کامل در زندگی ما وارد شده است. ChatGPT، Gemini، Apple Intelligence و رقبای آنها نشان دادند که ابزارهای هوش مصنوعی میتوانند شگفتانگیز باشند و حتی زمانی که بهدرستی استفاده شوند، واقعاً مفید باشند.
این به این معنا نیست که ۲۰۲۵ بدون اشتباهات و خطاها خواهد بود، اما قطعاً این احتمال وجود دارد که هوش مصنوعی به بخش استانداردی از بسیاری از فعالیتهای دیجیتال در برخی سطوح تبدیل شود، خواه در تلاش برای برگزاری شب بازی با دوستان، سرگرم و آموزش دادن به کودکان، یا سازماندهی برنامههای غذایی و آشپزی ما. امسال نشان داد که هوش مصنوعی چه کارهایی میتواند انجام دهد؛ سال آینده، سوال این خواهد بود که کدامیک از این تواناییها را واقعاً میخواهیم هوش مصنوعی برای ما انجام دهد؟
منبع: Eric Hal Schwartz