استارتاپ هوش مصنوعی فرانسوی Mistral اولین مدلهای تولیدی هوش مصنوعی خود را که برای اجرا بر روی دستگاههای لبهای مانند لپتاپها و تلفنهای همراه طراحی شدهاند، منتشر کرده است.
خانواده جدید مدلها که Mistral آن را “Les Ministraux” نامیده است، میتواند برای طیف گستردهای از کاربردها، از تولید متن پایه تا کار در کنار مدلهای قویتر برای انجام وظایف، استفاده یا تنظیم شود.
دو مدل Les Ministraux در دسترس هستند – Ministral 3B و Ministral 8B – که هر دو دارای پنجرهای متنی با ۱۲۸,۰۰۰ توکن هستند، به این معنی که میتوانند متنی به طول حدود یک کتاب ۵۰ صفحهای را پردازش کنند.
Mistral در یک پست وبلاگی مینویسد: “مشتریان و شرکای نوآور ما به طور فزایندهای خواستار استنتاج محلی و اولویتدهی به حریم خصوصی برای کاربردهای حیاتی مانند ترجمه روی دستگاه، دستیاران هوشمند بدون اینترنت، تحلیلهای محلی و رباتیک خودمختار هستند.” “Les Ministraux برای ارائه یک راهحل بهینه و کمتأخیر برای این سناریوها طراحی شده است.”
مدل Ministral 8B از امروز برای دانلود در دسترس است – اما فقط برای اهداف تحقیقاتی. Mistral از توسعهدهندگان و شرکتهایی که علاقهمند به استقرار خودکار Ministral 8B یا Ministral 3B هستند میخواهد تا برای اخذ مجوز تجاری با آنها تماس بگیرند.
در غیر این صورت، توسعهدهندگان میتوانند از Ministral 3B و Ministral 8B از طریق پلتفرم ابری Mistral، به نام La Platforme، و سایر ابرهایی که این استارتاپ در هفتههای آینده با آنها همکاری کرده است، استفاده کنند. هزینه استفاده از Ministral 8B معادل ۱۰ سنت برای هر یک میلیون توکن خروجی/ورودی (حدود ۷۵۰,۰۰۰ کلمه) است، در حالی که هزینه Ministral 3B معادل ۴ سنت برای هر یک میلیون توکن خروجی/ورودی است.
اخیراً گرایشی به سمت مدلهای کوچکتر دیده شده است که ارزانتر و سریعتر از همتایان بزرگتر خود آموزش داده، تنظیم و اجرا میشوند. گوگل همچنان مدلهایی را به خانواده مدلهای کوچک Gemma اضافه میکند، در حالی که مایکروسافت مجموعه مدلهای Phi خود را ارائه میدهد. در تازهترین بهروزرسانی مجموعه Llama خود، Meta چندین مدل کوچک بهینهشده برای سختافزار لبهای معرفی کرد.
Mistral ادعا میکند که Ministral 3B و Ministral 8B از مدلهای Llama و Gemma مشابه، و همچنین مدل Mistral 7B خود، در چندین بنچمارک هوش مصنوعی طراحیشده برای ارزیابی قابلیتهای پیروی از دستورالعمل و حل مسئله، عملکرد بهتری دارند.
Mistral که در پاریس مستقر است و اخیراً ۶۴۰ میلیون دلار سرمایه خطرپذیر جذب کرده است، همچنان به گسترش تدریجی پورتفولیو محصولات هوش مصنوعی خود ادامه میدهد. در چند ماه گذشته، این شرکت یک سرویس رایگان برای توسعهدهندگان به منظور آزمایش مدلهای خود راهاندازی کرده است، یک SDK برای تنظیم مدلها به مشتریان ارائه داده است و مدلهای جدیدی از جمله یک مدل تولیدی برای کد به نام Codestral را عرضه کرده است.
Mistral که توسط فارغالتحصیلان شرکتهای Meta و DeepMind گوگل تأسیس شده است، مأموریت خود را ایجاد مدلهای پرچمدار که با بهترین مدلهای امروزی مانند GPT-4 از OpenAI و Claude از Anthropic رقابت کنند و در نهایت کسب درآمد در این فرآیند اعلام کرده است. در حالی که کسب درآمد چالشی بوده است (همانطور که برای اکثر استارتاپهای هوش مصنوعی تولیدی چالشی است)، گفته میشود Mistral از تابستان امسال شروع به کسب درآمد کرده است.