شرکت چینی علیبابا به تازگی از یک مدل هوش مصنوعی جدید به نامهای Qwen-VL و Qwen-VL-Chat رونمایی کرده که به گفته این شرکت، از قابلیت درک تصاویر و مدیریت مکالمات پیچیده بهره می برد.
علی بابا اعلام کرده مدلهای مذکور، منبعباز هستند و این یعنی، محققان، دانشگاهیان و شرکتها در سراسر جهان میتوانند از آنها برای ساخت اپلیکیشنهای هوش مصنوعی بدون نیاز به آموزش سیستمهای خود استفاده کنند. بنابراین، از لحاظ زمانی و هزینه، بهصرفه خواهد بود.
به گفته علیبابا، مدل هوش مصنوعی Qwen-VL میتواند به پرسشهای مرتبط با تصاویر مختلف پاسخ دهد و کپشنهایی را برای عکسها تولید کند. همچنین کاربران میتوانند تعامل پیچیدهتری را با مدل Qwen-VL-Chat داشته باشند.
از جمله کارهایی که مدل دوم یعنی Qwen-VL-Chat میتواند انجام دهد میتوان به داستان نویسی، خلق تصاویر با توجه به تصاویر ورودی کاربر و حل معادلات ریاضی نشانداده شده در یک تصویر اشاره کرد.
در یکی از مثالهای علیبابا برای نمایش قابلیتهای این مدل هوش مصنوعی، تصویری از تابلوی بیمارستان به زبان چینی نمایش داده شد که این مدل توانست با تفسیر علائم، به سوالات مربوط به مکان بخشهای مختلف بیمارستانی پاسخ دهد.