درک تصاویر و دستورات پیچیده توسط این مدل هوش مصنوعی

شرکت چینی علی بابا دو مدل را با استفاده از هوش مصنوعی مولد توسعه داده که قادر به انجام مکالمات پیچیده و درک تصاویر هستند.

درک تصاویر و دستورات پیچیده توسط این مدل هوش مصنوعی

به گزارش چابک آنلاین به نقل از فارس، در حالی که غول‌های فناوری مانند اپن ای آی و گوگل مدل‌های زبان بزرگ (LLM) را برای رقابت در فضای پررونق هوش مصنوعی مولد راه‌اندازی می‌کنند، شرکت چینی علی بابا 2 مدل هوش مصنوعی جدید را راه‌اندازی کرده که می‌توانند مکالمات پیچیده را انجام دهند و تصاویر را درک کنند.

2 مدل غول فناوری چینی با نام های Qwen-VL و Qwen-VL-Chat برای محققان، دانشگاهیان و شرکت ها در دسترس خواهد بود تا آنها بتوانند برنامه های هوش مصنوعی خود را بدون نیاز به آموزش سیستم ها توسعه دهند.

ویژگی های مدل های هوش مصنوعی علی بابا

به گفته علی‌بابا، در حالی که Qwen-VL می‌تواند به پرسش‌های مرتبط با تصاویر مختلف پاسخ دهد و شرح تصاویر ایجاد کند، Qwen-VL-Chat می‌تواند در تعامل‌های پیچیده شرکت کند. به عنوان مثال، می‌تواند چندین ورودی تصویر را با هم مقایسه کند و به چندین دور سؤال پاسخ دهد.

سایر وظایفی که Qwen-VL-Chat می تواند انجام دهد شامل نوشتن داستان، ایجاد تصاویر بر اساس عکس هایی است که کاربر وارد می کند و حل معادلات ریاضی نشان داده شده در یک تصویر است.  

پیش از این خبری نشان داد که هوش مصنوعی در طول ۱ سال بیشتر از همه تصاویر تولید شده توسط انسان در طی 150 سال عکس تولید کرده است.

تا به حال، شرکت‌ها بر تولید محتوا بر اساس ورودی متن توسط انسان تمرکز کرده‌اند، اما Qwen-VL-Chat، تقریباً شبیه آخرین نسخه چت جی پی تی، می‌تواند تصاویر را تجزیه و تحلیل کند و به متن پاسخ دهد. این دو مدل بر روی مدل بزرگ زبانی این شرکت به نام Tongyi Qianwen که در اوایل سال جاری منتشر شد، توسعه یافته اند.

این خبر بلافاصله پس از آن منتشر شد که غول اینترنتی کره جنوبی ناور از HyperCLOVA X، مجموعه ابزارهای هوش مصنوعی و اپلیکیشن چت بات CLOVA X خود رونمایی کرد.

ناور گفت که این محصول جستجوهای مبتنی بر هوش مصنوعی را برای کاربران فراهم می کند و خدمات سفارشی را برای شرکت ها ارائه می دهد. CLOVA X با هدف بهبود جستجوی وب، خرید آنلاین و خدمات ناوبری راه اندازی شده است.

این شرکت همچنین گفت که در حال همکاری با سامسونگ برای توسعه تراشه جدیدی است که جهت پشتیبانی از توسعه فناوری هوش مصنوعی آن کوچکتر و کارآمدتر خواهد بود. ناور همچنین در حال برنامه ریزی برای افتتاح یک مرکز داده جهت خدمات HyperCLOVA X در ماه نوامبر(آبان-آذر) است.

علاقه به هوش مصنوعی مولد و ربات های گفت و گو، ترس‌هایی را در مورد نابودی مشاغل ایجاد کرده است، مشابه آنچه که در زمان معرفی خط مونتاژ متحرک در اوایل دهه 1900 و پس از رایانه‌های بزرگ در دهه 1950 پدیدار شد. با این حال، مطالعه ارائه شده توسط سازمان بین المللی کار نشان داده بیشتر مشاغل و صنایع فقط تا حدی در معرض اتوماسیون هستند و بنابراین احتمال بیشتری وجود دارد که به جای جایگزینی، با هوش مصنوعی تکمیل شوند، به این معنی که مهمترین تأثیر فناوری احتمالاً کارافزایی است.

از زمانی که شرکت اپن ای آی ربات گفت و گوی مولد خود را منتشر کرده است بسیاری از شرکت ها تلاش کردند تا از غافله مسابقه هوش مصنوعی مولد عقب نمانند و بسیاری دیگر از ربات چت جی پی تی در محصولات خود مانند ماشین ها و دوچرخه ها استفاده کردند.

 

copied
نظر بگذارید