۱۰ بهمن ۱۴۰۳ دکتر علی‌اصغر هنرمند

چرا DeepSeek دنیای هوش مصنوعی را شوکه کرده است؟

طی چند روز گذشته یک مدل هوش مصنوعی از کشور چین به نام DeepSeek سروصدای زیادی به راه‌انداخته و حتی بازار بورس دنیا را تکان داده است.

برای مثال، سهام شرکت انویدیا نزدیک به ۶۰۰ میلیارد دلار اُفت کرده که بزرگ‌ترین سقوط آزاد در تاریخ بورس جهان به شمار می‌آید! (هرچند تا اینجا حدود ۲۶۰ میلیارد از سقوط اولیه دوباره بازگشته است).

اما مگر دیپ سیک (DeepSeek) با مدل‌های زبانی جدیدش چه کرده که چنین موجی به راه افتاده؟ جالب است بدناید که این شرکت تازه حدود یک سال قبل تاسیس شده است!

اینجا سعی می‌کنیم به طور خلاصه و به زبان ساده موضوع را شرح دهیم و برای این کار از توضیحات آقای مورگان براون (مدیر هوش مصنوعی شرکت دراپ باکس) کمک می‌گیریم:

در حال حاضر آموزش‌ (train) مدل‌های هوش مصنوعی بسیار پرهزینه است. مثلا شرکت‌هایی مانند OpenAI صدها میلیون دلار صرف دیتاسنترها و زیرساخت‌های سخت‌افزاری می‌کنند. در هر کدام از این دیتاسنترها هزاران پردازشگر گرانقیمت (ساخت شرکت انویدیا) قرار دارد.

اما شرکت دیپ سیک ناگهان از راه رسید و بازی را عوض کرد: آنها نشان دادند که می‌توان یک کار ‍۱۰۰ میلیون دلاری را با ۵ میلیون دلار انجام داد و به نتیجه‌ای بسیار نزدیک دست یافت.

مدل ارائه شده‌ی آنها در بسیاری از کارها از GPT-4 و Claude بهتر عمل کرده و این دنیای هوش مصنوعی را تکان داده است.

آنها در فرایند تولید مدل جدید، همه چیز را از زاویه‌ی متفاوتی نسبت به روش‌های فعلی دیده‌اند:

مدل آنها ۷۵ درصد حافظه‌ی کمتری مصرف می‌کند و از سیستمی به نام multi-token استفاده می‌کند.

مدل‌های فعلی مانند بچه‌ی کلاس اولی کار می‌کند و کلمه به کلمه می‌خواند. اما دیپ سیک عبارات طولانی‌تر و جملات را می‌بینید و به همین خاطر دوبرابر سریع‌تر است و با این حال به اندازه ۹۰ درصد هم دقت دارد.

دیپ سیک یک کار هوشمندانه‌ی دیگر هم انجام داده: مدل‌های فعلی همه کاره هستند و می‌توانند همزمان در نقش پزشک، معمار و برنامه نویس عمل کنند. به همین خاطر مثلا ۱.۸ تریلیون پارامتر همزمان فعال هستند.

اما دیپ سیک وظایف تخصصی را از هم جدا کرده‌ و فقط هنگام نیاز از آنها استفاده می‌کند.

نتیجه این شده که هزینه آموزش مدل از ۱۰۰ میلیون دلار به ۵ میلیون رسیده. تعداد پردازشگرهای مورد نیاز از ۱۰۰ هزار به ۲ هزار رسیده و هزینه API هم حدود ۹۵ درصد ارزان‌تر شده است.

مدل جدید خبر خوبی برای شرکت انویدیا نیست، چون رشد فوق العاده‌ی این شرکت مرهون نیاز مدل‌های هوش مصنوعی به پردازشگرهای متعدد و گران است.

دیپ سیک طراحی مدل جدید را با یک تیم کوچک ۲۰۰ نفره انجام داده، در حالی که در شرکت‌های بزرگ «سیلیکون ولی» تیم‌های بزرگی روی مدل‌ها کار می‌کنند.

جالب است بدانید که طی همین چند روزی که از ارائه دیپ سیک گذشته، اپلیکیشن آن در اپ استور در قسمت اپلیکیشن‌های رایگان به رتبه اول ارتقا پیدا کرده و چت جی‌پی تی و گوگل جمنای در جایگاه دوم و سوم قرار گرفته‌اند!

البته پشت سر این شرکت حرف‌هایی هم زده می‌شود. برای مثال برخی کارشناسان می‌گویند که هزینه آموزش مدل این شرکت خیلی بیشتر از ۵ میلیون دلار ادعا شده است.

اما با وجود همه این حرف‌ها، دیپ سیک بازی را عوض کرده و رقابت بسیار جدی‌تر شده و البته نتیجه‌ی آن به نفع مصرف‌کنندگان خواهد بود.

چون قاعدتا بازیگران بزرگ هوش مصنوعی هم از نوآوری‌های دیپ سیک استفاده خواهند کرد. مهم‌ترین لطف دیپ سیک هم این بوده که مدلش را به صورت بازمتن ارائه کرده است.

https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27

https://twitter.com/morganb/status/1883686162709295541

مطالب مرتبط

تست توانایی و عملکرد منطقی هوش مصنوعی در پاسخ به پرسش‌های پزشکی: تحول در یادگیری با مدل جدید OpenAI o1

شرکت OpenAI شب گذشته نسخه‌ پیش‌نمایش مدل جدید هوش مصنوعی‌اش را با نام ChatGPT-o1 معرفی کرد و آن را در اختیار کاربران قرار داد. این مدل طراحی شده تا پاسخ‌های دقیق‌تری بدهد و البته زمان بیشتری را هم به فکر کردن اختصاص می‌دهد تا از صحت پاسخ‌هایش اطمینان حاصل کند. تصمیم گرفتم توانایی مدل جدید […]

آشنایی با ۶ چالش هوش مصنوعی در ورود به حوزه‌ی سلامت و پزشکی

هوش مصنوعی به سرعت در حال تغییر دنیا است و به‌نظر می‌رسد با یک انقلاب در رشته‌های گوناگون مواجه هستیم. در بخش سلامت و پزشکی هم صدای پای هوش مصنوعی از گوشه و کنار به گوش می‌رسد. اما اگر کمی دقیق‌تر نگاه کنیم، متوجه می‌شویم داستان هوش مصنوعی و پزشکی با چالش‌های خاصی مواجه است […]

فاصله میان توانایی‌های هوش مصنوعی و انسان چقدر است؟

«لکس فریدمن» در پادکستش به موضوعات متنوعی می‌پردازد و هوش مصنوعی به خاطر تخصص خودش از موضوعاتی است که زیاد مورد گفتگو قرار می‌گیرد. در اپیزود جدیدی که حدود دو هفته پیش منتشر شده، گفتگویی با آقای «یان لاکون» صورت گرفته. آقای یاکون مدیر ارشد هوش مصنوعی در شرکت متا، مدرس دانشگاه نیویورک و برنده […]

شباهت فرایند تشکیل خاطرات هوش مصنوعی با مغز انسان و تلاش برای بهبود آن

به نظر شما «حافظه‌ی» هوش مصنوعی چگونه کار می‌کند؟ پاسخ اینجاست که فرایند یادگیری و تشکیل خاطرات هوش مصنوعی تا حد زیادی شبیه مغز انسان است! با این تفاوت که هوش مصنوعی فعلا برای عملکرد و تشکیل حافظه به منابع و انرژی زیادی نیاز دارد. در حالی که مغز انسان «فعلا» بسیار بهینه‌تر عمل می‌کند. […]

آیا هوش مصنوعی جایگزین پزشکی و طبابت می‌شود؟

اگر از هوش مصنوعی‌های پرطرفدار فعلی (مثلا ChatGPT) بپرسید که آیا «آنها جایگزین پزشکی می‌شوند؟» به شما پاسخ می‌دهد: خیر! هوش مصنوعی به هیچ عنوان جایگزین پزشک نخواهد شد و فقط ابزاری است که به پزشکان در تشخیص و درمان بیماری‌ها «کمک» خواهد کرد. اما آیا باید این پاسخ را «باور» کنیم؟ به‌ویژه اینکه می‌دانیم […]

کمک هوش مصنوعی به تشخیص دقیق‌تر سکته قلبی

اگر در اورژانس با بیمار درد قفسه سینه مواجه شوید چه می‌کنید؟ قاعدتا اگر مشکوک به حمله قلبی باشیم، تست تروپونین می‌گیریم و باید این کار چند مرتبه تکرار شود تا تغییرات آن را مشاهده کنیم. مشکل این روش این است که برخی بیماران بیش از حد در اوژرانس بستری می‌شوند و تخت‌ها را اشغال […]

مطالب داغ

وجود ماده‌ی سرطان زای بنزن در محصولات ضد آکنه؟

در بسیاری از محصولات ضد آکنه از ماده‌ای به نام بنزوئیل پراکسید (Benzoyl Peroxide) استفاده می‌شود که سبب خشک شدن پوست ناحیه و کاهش باکتری‌های ایجاد کننده‌ی آکنه می‌شود. حالا یک آزمایشگاه مستقل حدود ۱۰۰ محصول ضد آکنه‌ی حاوی بنزوئیل پراکسید را مورد آزمایش قرار داده و متوجه شده در صورت نگهداری آنها در دمای […]

چرا دراز کشیدن به جلسات روان‌درمانی کمک می‌کند؟

تا به حال به نکته فکر کرده‌اید که چرا در اغلب جلسات روان‌درمانی به افراد پیشنهاد می‌شود روی مبل دراز بکشند؟ به‌نظر می‌رسد زیگموند فروید بنیانگذار «دانش روانکاوی» این نحوه دراز کشیدن را ابداع کرده و در یادداشت‌هایش در سال ۱۹۱۳ گفته: هدف این است که بیمار روی یک مبل دراز بکشد و درمانگر به‌گونه‌ای […]

معرفی یک شبیه‌ساز پیشرفته‌ برای آموزش کمک‌های اولیه

این یک مولاژ (عروسک شبیه‌ساز) کمک‌های اولیه است که روز گذشته در نمایشگاه CES2024 معرفی شد و از آن می‌توان برای انجام تمرین‌های بسیار متنوعی استفاده کرد. از جمله عملیات احیا (CPR) و انجام جراحی‌های متنوع. جالب است بدانید که پوست این مولاژ نسبت به لمس حساس است و روی یک لپ‌تاپ می‌توانید ببینید که […]

تصویر بند انگشتی
حداقل میزان فعالیت بدنی لازم چقدر است؟

برخی افراد به دنبال این پرسش هستند که حداقل میزان فعالیت بدنی که می‌توان انجام داد و در عین حال به سلامت‌مان کمک کرد چقدر است؟ اکنون احتملا یک پژوهش پاسخی برای آن دارد: پیاده‌روی به میزان ۸۰۰۰ قدم برای یک الی دو بار در هفته! این پژوهش مدعی است افرادی که این میزان فعالیت […]

مطالب پربازدید

آیا تیرزپاتید (Tirzepatide) در درمان چاقی یک انقلاب ایجاد می‌کند؟

این روزها داروهای کاهش وزنی که با اثر روی گیرنده GLP1 عمل می‌کنند، طرفداران زیادی پیدا کرده‌اند و سماگلوتید (semaglutide) در خط مقدم آنها است. حالا یک داروی دیگر به نام تیرزپاتید (Tirzepatide) هم احتمالا به لیست داروهای لاغری اضافه خواهد شد و این یکی حتی از سماگلوتید هم بهتر عمل می‌کند. این دارو در […]

میزان مناسب و بهترین روش مصرف ویتامین D: روزانه؟ هفتگی یا ماهیانه؟

ویتامین D جزو ویتامین‌های مهمی است که کمبود آن در تمام دنیا شیوع بالایی دارد و پیش‌بینی می‌شود حدود یک میلیارد نفر در سراسر جهان به کمبود آن دچار هستند. در اینجا می‌خواهیم به این نکته بپردازیم که بهترین روش مصرف مکمل ویتامین دی چگونه است و مقدار مناسبش چقدر است؟ اما پیش از شروع […]

تایید داروی تیرزپاتید (Tirzepatide) برای کاهش وزن توسط سازمان غذا و داروی آمریکا

اواخر اردیبهشت از نتایج قابل توجه داروی تیرزپاتید (Tirzepatide) در کاهش وزن صحبت کردیم. حالا سرانجام استفاده از این دارو توسط سازمان غذا و داروی آمریکا برای دو گروه از افراد مورد تایید قرار گرفته است: ۱- افراد چاق (دارای BMI بالای ۳۰)
۲- افرادی که دارای اضافه وزن هستند (BMI بالای ۲۷) و یکی از […]

تیرزپاتید، ویگووی، ویکتوزا و… پاسخ به پرسش‌های رایج در مورد داروهای لاغری و کاهش وزن GLP1

قبلا در «آپدیت ام دی» در مورد داروهای لاغری و کاهش وزن زیاد صحبت کرده‌ایم. در میان آنها یک دسته دارویی خاص طی چند سال گذشته محبوبیت ویژه‌ای پیدا کرده‌اند. اینها جزو یک کلاس دارویی به نام «آگونیست گیرنده پپتید شبه گلوکاگون ۱» یا به طور خلاصه «آگونیست GLP1» هستند. جالب است بدانید اغلب این […]

با همکاری

پژوهشکده آینده پژوهی در سلامت
پژوهشکده آینده پژوهی در سلامت
معاونت آموزشی سازمان نظام پزشکی کل کشور
معاونت آموزشی سازمان نظام پزشکی کل کشور
اداره کل آموزش همگانی جمعیت هلال احمر
اداره کل آموزش همگانی جمعیت هلال احمر
X
آپدیت ام دی تازه‌های پزشکی از رفرنس‌های معتبر