به گزارش روز چهارشنبه گروه علمی ایرنا، بنیاد ملی علم ایران در راستای مأموریتگرا شدن پژوهشها و حمایت از طرحهای پژوهشی که به فناوری روز دنیا میپردازد و میتواند باری از دوش صنعتگران کشور بردارد، فراخوانهایی را با عنوان برنامه حمایت از پژوهش عمیق شرکتهای دانشبنیان منتشر میکند.
«نحوه توسعه مدلهای زبانی بزرگ مناسب برای زبان فارسی و قابل استفاده در یک چتبات سازمانی» بهعنوان یکی دیگر از فراخوانهای این برنامه، منتشر میشود و افراد واجد شرایط تا پایان فروردین ۱۴۰۴ فرصت دارند که پروپوزال خود را از طریق سامانه کایپر برای بنیاد ملی علم ایران ارسال کنند.
توضیحات فراخوان
هدف اصلی این پژوهش نیازمندی شرکت در نحوه استفاده از LLM های فارسی در تکامل محصولات چتبات جاری است. که با استفاده از آن بتوان نیازهای متنوع مشتریان چتبات را پاسخ داد. مجری باید بتواند با استفاده از LLM های موجود (داخلی و خارجی)، راهحلهای مجزایی به شرکت ارائه کند که بتوان برای هر مشتری بهصورت جداگانه چتبات مخصوص آن را ساخت.
این تحقیق باید بتواند کارهایی از قبیل پرسش و پاسخ، تشخیص مقصود، جداسازی اسلاتها، تشخیص مفهوم متن، خلاصهسازی و جستجوی معنایی را با استفاده از مدلهای زبانی بزرگ (LLM) انجام دهد.
تبیین و تشریح مساله پژوهشی
بنیاد ملی علم ایران در تبیین این مساله اعلام داشت: درخصوص LLM ها، مدلهای Open Source نسبتاً زیادی وجود دارد و برخی از آنها فارسی را نیز پشتیبانی میکنند. نیاز فعلی ما توسعه LLM فارسی و عمومی نیست بلکه هدف آن است که از یک LLM فارسی (چه اپن سورس خارجی یا نسخههای فارسی موجود داخلی) و چه سرویسهایی مانند ChatGPT استفاده کرد و چتباتهای منطبق با نیاز مشتریان را توسعه داد.
لذا در این پروژه به دنبال Fine Tuning کل مدل LLM نیستیم و هدف، استفاده از LLM ها برای پاسخدهی به نیازهای متنوع مشتریان است. حال ممکن است در این راه نیاز به Fine Tune هم باشد که این عملیات یک Fine Tunning بسیار کوچک و در قالب دامنه محتوایی مشتری انجام میشود که بتوان یک چتبات مخصوص آن مشتری تهیه نمود. لذا LLM پایهای انتخابی میتواند هرکدام از LLM های Open Source داخلی یا خارجی باشد، و اصلاً یکی از وظایف مجری مقایسه LLM های موجود و انتخاب بهترین آن برای پاسخدهی به نیاز مشتری میباشد.
مجری لازم است که نحوه بهکارگیری مدلهای زبانی بزرگ را برای هر مشتری بهصورت جداگانه انجام دهد. حال این روش میتواند از Zero Shot تا Fine Tune به تناسب نیاز هر مشتری متفاوت باشد. لازم به ذکر است مجری باید معماری و نحوه انجام این عملیات را بهصورت کامل برای کارفرما انجام دهد، تا کارفرما توانایی انجام این نوع کارها را برای سایر مشتریان نیز به دست آورد. بهطور خلاصه چند نمونه از نیاز مشتریان به مجری، اعلام و مجری برای هر کدام بهصورت جداگانه باید یک LLM و همچنین راهکار استفاده بهینه از آن را ارائه دهد.
علاقهمندان برای دسترسی به متن کامل این فراخوان اینجا را کلیک کنند.
نظر شما