نام رویداد:

کارگاه ظهور معماری‌های تخصصی هوش مصنوعی

نام مدرس: از سری نشست های:

توسط مرکز رشد و نوآوری پژوهشگاه برگزار می‌شود :

  • زمان: دوشنبه ۲۲ و ۲۳ دی ۱۴۰۴ از ساعت ۱۴ تا ۱۸ عصر 
  • مکان: کارگاه به صورت حضوری برگزار می شود .
  •  ثبت‌نام محدود است .

توضیحات

تحلیل مقایسه‌ای ۸ الگوی مدل هوش مصنوعی در عصر پسا-مدل‌های زبان بزرگ (Post-LLM Era)

ارائه‌دهنده: علیرضا قبادی

مدت: ۲ روز (هر جلسه ۳ تا ۴ ساعت)

تمرکز: تحلیل تحول چشمگیر منظره هوش مصنوعی، که از مدل‌های زبان بزرگ (LLM) تک‌سنگ فاصله گرفته و به سمت اکوسیستم متنوع‌تر و تخصصی‌تر هوش مصنوعی حرکت کرده است. این حرکت با هدف بهینه‌سازی کارایی محاسباتی و انرژی و فعال‌سازی تخصص عمیق دامنه-محور صورت می‌گیرد.

سرفصل‌ها وموضوعات کارگاه

روز اول: محدودیت‌های بنیادی، چارچوب مقایسه‌ای و مدل‌های کارایی (حدود ۳ تا ۴ ساعت)

تمرکز اصلی: درک سقف LLM، معرفی ابزارهای تحلیلی و بررسی مدل‌هایی که برای مقیاس‌پذیری و کاهش هزینه طراحی شده‌اند.

عنوان بخشموضوعات کلیدی برای اطلاعیه و سرفصل‌ها
ماژول ۱ و ۲: خلاصه اجرایی و مقدمه (سقف LLM)بررسی رانشگرهای اصلی این تحول شامل: بهینه‌سازی کارایی محاسباتی و انرژی، غلبه بر محدودیت‌های اشباع پنجره متن (Context Window Saturation)، و فعال‌سازی یکپارچه‌سازی چندوجهی بدون نقص. تحلیل محدودیت‌های LLMهای سنتی از جمله هزینه‌های محاسباتی ممنوع‌کننده، سختی مدالیته (ماهیت صرفاً متنی)، و عدم وجود تخصص عمیق دامنه-محور.
ماژول ۳: تعریف چارچوب مقایسه‌ایمعرفی پنج محور ارزیابی برای تحلیل معماری هوش مصنوعی: مدالیته ورودی/خروجی (انواع داده‌ها)، معماری هسته (مانند ترانسفورمر، مدل انتشار)، مکانیزم‌های بهینه‌سازی (مانند فشرده‌سازی توکن، مسیریابی متخصص)، پیچیدگی یکپارچه‌سازی، و دامنه‌های کاربردی.
ماژول ۴: بررسی مدل‌های بنیادی و کاراییمدل‌های زبان بزرگ (LLM): ترانسفورمر صرفاً زبانی. موارد استفاده: چت‌بات‌ها، خلاصه‌سازی. مدل‌های زبان نقاب‌دار (MLM): پیش‌آموزش زمینه‌ای از طریق نقاب‌گذاری. مزیت: درک قوی متنی. موارد استفاده: جستجو، پرسش و پاسخ اسناد (QAS).
ماژول ۵: معماری‌های کارایی و مقیاس‌پذیریترکیب متخصصان (MoE): مسیریابی متخصص ماژولار. مزیت: کارایی، مقیاس‌پذیری، کاهش هزینه محاسباتی. موارد استفاده: خدمات هوش مصنوعی در مقیاس ابری. مدل‌های زبان کوچک (SLM): ترانسفورمر فشرده بهینه شده برای دستگاه‌های با منابع محدود. مزیت: کارایی، استنتاج محلی (Local Inference). موارد استفاده: هوش مصنوعی موبایل.
مبحث ویژه: SLM و امنیت هوش مصنوعیبررسی اینکه چگونه بهینه‌سازی روی دستگاه (On-device Optimization) در SLMها امکان اجرای مدل‌های حفظ‌کننده حریم خصوصی (privacy-preserving AI) را فراهم می‌کند، که یک جزء حیاتی در امنیت سایبری و مدیریت داده‌ها است.

 

روز دوم: یکپارچه‌سازی چندوجهی و هیبریدهای مولد/استدلالی (حدود ۳ تا ۴ ساعت)

تمرکز اصلی: کاوش مدل‌های طراحی شده برای پردازش داده‌های متنوع، تولید پیشرفته، و استدلال پیچیده برای کاربردهای تخصصی.

عنوان بخشموضوعات کلیدی برای اطلاعیه و سرفصل‌ها
ماژول ۶: معماری‌های یکپارچه‌سازی چندوجهیمدل‌های زبان-بینایی (VLM): فعال‌سازی درک مشترک تصویر و متن از طریق رمزگذار بینایی و متنی. مزیت: پرسش و پاسخ بصری. موارد استفاده: جستجوی چندوجهی. مدل هر چیزی را قطعه‌بندی کن (SAM): مدل بینایی تخصصی برای وظایف بصری هدایت‌شده با پرامپت. مزیت: بخش‌بندی بصری قابل تعمیم (Generalizable Visual Segmentation).
مبحث ویژه: بینایی کامپیوتر و تصویربرداری پزشکیتمرکز بر استفاده از قابلیت بخش‌بندی بصری قابل تعمیم SAM در تصویربرداری پزشکی برای تسهیل تشخیص زودهنگام و پشتیبانی از تشخیص خودکار بیماری‌ها، به عنوان مثال‌هایی از کاربردهای تخصصی بینایی کامپیوتر.
ماژول ۷: هیبریدهای مولد و استدلالیمدل‌های شرطی‌شده با زبان (LCM): ترکیب مدل‌های انتشار (Diffusion) با شرطی‌سازی زبانی. مزیت: قابلیت‌های تولید متن به هر مدالیته. موارد استفاده: ترکیب چندوجهی، تولید محتوای خلاقانه. مدل‌های منطق-عملیاتی (LAM): سیستم استدلال عصبی-نمادی با قابلیت‌های حافظه یکپارچه. مزیت: برنامه‌ریزی وظایف پیچیده، استدلال متوالی. موارد استفاده: سیستم‌های خودمختار، رباتیک.
مبحث ویژه: امنیت سایبری و استدلال عصبی-نمادیبررسی نقش LAMها در حوزه امنیت سایبری و دفاع هوش مصنوعی از طریق استفاده از قابلیت‌های استدلال متوالی و برنامه‌ریزی وظایف برای ساخت سیستم‌های دفاعی خودکار و اتوماسیون گردش کار پیچیده.
ماژول ۸: سنتز و چشم‌انداز آیندهمرور جدول مقایسه‌ای و بحث در مورد چگونگی رفع مشکل عدم وجود تخصص عمیق دامنه-محور در LLMها توسط مدل‌های تخصصی. شناسایی دامنه‌های کاربردی که در آن‌ها هر مدل مؤثرترین عملکرد را دارد (مانند هوش مصنوعی موبایل، سیستم‌های خودمختار، خدمات ابری).

مفاهیم کلیدی برای برجسته کردن در اطلاعیه (خلاصه)

  • انتقال پارادایم: هدف، گذار از LLMهای عمومی به اکوسیستم تخصصی است که بر اساس بهینه‌سازی کارایی محاسباتی و انرژی بنا شده است.
  • شکستن سیلوی داده: یادگیری درباره یکپارچه‌سازی چندوجهی (مانند VLMها) که مرزهای بین انواع داده‌ها (متن، تصویر) را می‌شکند.
  • استدلال پیشرفته: درک استدلال عصبی-نمادی (مانند LAMها) برای استنتاج منطقی قوی‌تر و قابلیت توضیح بهتر.
  • کاربرد در حوزه‌های حساس: نحوه استفاده از SAM برای بخش‌بندی بصری در تصویربرداری پزشکی و استفاده از SLM و LAM برای امنیت سایبری و ساخت سیستم‌های دفاعی خودکار.