Gemma 3 وارد میشود: گوگل با مدل‌ های زبانی باز به جنگ OpenAI میرود!

چکیده

گوگل از Gemma 3، خانواده‌ای از مدل‌ های هوش مصنوعی باز و قدرتمند، رونمایی کرد! ویژگی‌ ها، کاربردها و مقایسه با رقبا را در وبلاگ های ورت بخوانید!

۱۴۰۳ پنج شنبه ۲۳ اسفند

طلوع فصلی نو در آسمان هوش مصنوعی با Gemma 3

در سپهرِ پر تلاطم و شتابانِ هوش مصنوعی، هر روز شاهدِ ظهورِ پدیده‌ ای نو و اعجاب‌ آور هستیم. فناوری که روزی در صفحاتِ داستان‌ های علمی-تخیلی و رویاهایِ دوردستِ بشر جولان می‌داد، اکنون به واقعیتی ملموس و کاربردی در تار و پودِ زندگیِ روزمره‌ مان بدل گشته است. در این میان، شرکت‌ های بزرگِ فناوری همواره در تلاش‌ اند تا با نوآوری و خلاقیت، مرزهایِ دانشِ بشری را در این عرصه گسترش دهند و محصولاتی کارآمدتر و هوشمندتر را به جهانیان عرضه نمایند. های‌ ورت در این مقاله، به بررسیِ تازه‌ ترین دستاوردِ شرکت گوگل در حوزه هوش مصنوعی، یعنی مدل زبانی Gemma 3 می پردازد؛

مدلی که با قابلیت‌ هایِ منحصربه‌فردِ خود، نویدبخشِ تحولی شگرف در این حوزه است. گوگل، این‌ بار با دستانی پُر و با کوله‌ باری از تجربه و دانش، به میدان آمده تا بار دیگر، جایگاهِ پیشتازِ خود را در عرصه هوش مصنوعی تثبیت نماید. با ما همراه باشید تا در این سفرِ اکتشافی، به زوایایِ پنهان و آشکارِ Gemma 3 سرک بکشیم و از قابلیت‌ هایِ شگفت‌ انگیزِ آن پرده برداریم.

Gemma 3 چیست؟ معرفی نسلِ سوم از خانواده مدل‌ های متن‌ باز Gemma

خانواده مدل‌ های متن‌ باز Gemma، از بدوِ ظهور، به عنوانِ نمادی از تعهدِ گوگل به دسترس‌ پذیر نمودنِ فناوریِ هوش مصنوعی برای همگان، شناخته شده‌ اند. اکنون، پس از یک سال از معرفیِ نخستین نسلِ Gemma و استقبالِ بی‌ نظیرِ جامعه‌ توسعه‌ دهندگان و پژوهشگران (با بیش از 100 میلیون بارگیری و خلق بیش از 60 هزار گونه‌ مختلف از مدل‌ های Gemma، موسوم به Gemmaverse)، گوگل با افتخار از نسلِ سومِ این خانواده، یعنی Gemma 3، پرده برمی‌دارد.

به گزارش منبع رسمی گوگل (Introducing Gemma 3: The most capable model you can run on a single GPU or TPU)، Gemma 3 مجموعه‌ای از مدل‌های زبانی سبک‌وزن و پیشرفته است که بر پایه همان تحقیقات و فناوری‌ای بنا شده‌اند که موتورِ محرکِ مدل‌های Gemini 2.0، یعنی غولِ هوش مصنوعیِ گوگل، به شمار می‌روند.

این مدل‌ ها، پیشرفته‌ ترین، قابل‌ حمل‌ ترین و مسئولانه‌ ترین مدل‌ های متن‌ بازِ گوگل تا به امروز محسوب می‌شوند و برای اجرای سریع و مستقیم بر روی دستگاه‌ های مختلف، از تلفن‌ های همراه و لپ‌ تاپ‌ ها تا ایستگاه‌ های کاری، طراحی شده‌ اند. هدفِ غاییِ Gemma 3، یاری رساندن به توسعه‌ دهندگان در خلقِ کاربردهایِ هوش مصنوعی در هر مکانی است که مردم به آن‌ها نیاز دارند. Gemma 3 در اندازه‌ های گوناگون (1B، 4B، 12B و 27B) عرضه شده است تا توسعه‌ دهندگان بتوانند مدلِ متناسب با سخت‌ افزار و نیازهایِ عملکردیِ خاصِ خود را برگزینند.

قابلیت‌ های کلیدی و توانمندی‌ های Gemma 3: نسل نوینی از هوش مصنوعی قابل‌ حمل

Gemma 3 با کوله‌ باری از قابلیت‌ های نوین و توانمندی‌ های پیشرفته به میدان آمده است تا افق‌ های تازه‌ ای را در عرصه هوش مصنوعی قابل‌ حمل بگشاید. بر اساس اعلام گوگل، Gemma 3 قابلیت‌ های کلیدی زیر را در اختیار توسعه‌ دهندگان قرار می‌دهد:

عملکرد بی‌ نظیر در میان مدل‌ های تک-شتاب‌ دهنده (Single-Accelerator): Gemma 3 در اندازه‌ خود، عملکردی بی‌ نظیر ارائه میدهد و در ارزیابی‌ های مقدماتیِ ترجیحات انسانی در جدول رده‌ بندی LMArena، از مدل‌ هایی همچون Llama-405B، DeepSeek-V3 و o3-mini پیشی میگیرد. این برتریِ عملکردی به توسعه‌ دهندگان یاری میرساند تا تجربه‌ های کاربریِ جذاب‌ تری را خلق نمایند که قابلیت اجرا بر روی یک شتاب‌ دهنده‌ گرافیکی (GPU) یا شتاب‌ دهنده‌ تانسور (TPU) را داشته باشند.

پشتیبانی جهانی از 140 زبان: Gemma 3 با پشتیبانیِ پیش‌ فرض از بیش از 35 زبان و پشتیبانی از پیش‌ آموزش‌ دیده برای بیش از 140 زبان، توسعه‌ دهندگان را قادر میسازد تا کاربردهایی را خلق نمایند که به زبان مشتریان شان سخن می‌گویند و به این ترتیب، دایره‌ مخاطبانِ بالقوه‌ برنامه‌ های هوش مصنوعی را به گستره‌ جهانی گسترش دهند.

قابلیت‌ های استدلال پیشرفته‌ متنی و بصری: توسعه‌ دهندگان به مددِ Gemma 3 می‌توانند به آسانی کاربردهایی را طراحی نمایند که قادر به تحلیلِ تصاویر، متون و ویدیوهای کوتاه باشند و بدین ترتیب، درهایِ تازه‌ ای را به رویِ کاربردهایِ تعاملی و هوشمندِ هوش مصنوعی بگشایند.

پنجره‌ ست گسترده برای پردازش وظایف پیچیده: Gemma 3 با ارائه‌ پنجره‌ контекست 128k-token، برنامه‌ های کاربردی را قادر می‌سازد تا حجم عظیمی از اطلاعات را پردازش و درک نمایند و به این ترتیب، امکانِ انجام وظایفِ پیچیده‌ تر و نیازمند به درکِ kontekستِ بالا را فراهم میسازد.

قابلیت فراخوانی تابع (Function Calling) برای خودکارسازی گردش‌ های کاری: Gemma 3 از قابلیتِ فراخوانیِ تابع و خروجیِ ساختاریافته پشتیبانی می‌نماید تا توسعه‌ دهندگان بتوانند به سهولت گردش‌ های کاری را خودکار نموده و تجربه‌ های مبتنی بر عامل (Agentic Experiences) را خلق نمایند.

عملکردِ بهینه‌ شده و سریع‌ تر با مدل‌ های کوانتیزه‌شده: Gemma 3 نسخه‌ های رسمیِ کوانتیزه‌ شده را معرفی نموده است که با کاهش اندازه‌ مدل و الزامات محاسباتی، دقتِ بالا را حفظ می‌نمایند و به این ترتیب، امکانِ دستیابی به عملکردِ بالاتر و سرعتِ بیشتر را بر روی سخت‌ افزارهایِ محدودتر فراهم می‌سازند.

مقایسه Gemma 3 با رقبا: پیشتازی در عملکرد و کارایی

گوگل با انتشارِ نمودارهایِ مقایسه‌ ای، به روشنی برتریِ Gemma 3 را در مقابلِ رقبایِ قدرتمندِ خود به نمایش گذاشته است. بر اساسِ داده‌ های ارائه شده، Gemma 3 در بنچمارک‌ های معتبرِ عملکردِ هوش مصنوعی، همچون Chatbot Arena Elo، امتیازِ بالاتری را نسبت به مدل‌ هایی نظیر Llama-405B، DeepSeek-V3 و o3-mini کسب نموده است. نکته‌ حائز اهمیت آن است که Gemma 3 با وجودِ ارائه‌ عملکردی برتر، تنها به یک شتاب‌ دهنده‌ گرافیکی (GPU) برای اجرا نیاز دارد، در حالی که رقبایِ هم‌ سطحِ آن، به 32 شتاب‌ دهنده‌ گرافیکی نیازمندند.

این مزیتِ چشمگیر در کارایی، Gemma 3 را به گزینه‌ ای ایده‌ آل برای توسعه‌ دهندگانی بدل می‌سازد که به دنبالِ مدل‌ های هوش مصنوعی با عملکردِ بالا و الزاماتِ سخت‌ افزاریِ مقرون‌ به‌ صرفه هستند. های‌ ورت معتقد است که این برتریِ عملکردی، Gemma 3 را در جایگاهِ پیشتازِ مدل‌های هوش مصنوعی تک-شتاب‌ دهنده قرار داده است.

یکپارچگی و دسترس‌ پذیری Gemma 3 برای توسعه‌ دهندگان: آغوشی باز برای ابزارهای محبوب

Gemma 3 و ShieldGemma 2 به گونه‌ ای طراحی شده‌ اند که به سهولت با گردش‌ های کاریِ موجودِ توسعه‌ دهندگان یکپارچه شوند. از جمله‌ این امکانات میتوان به موارد زیر اشاره نمود:

سازگاری با ابزارهای توسعه محبوب: پشتیبانی از Hugging Face Transformers، Ollama، JAX، Keras، PyTorch، Google AI Edge، UnSloth، vLLM و Gemma.cpp، به توسعه‌ دهندگان انعطاف‌ پذیریِ لازم برای انتخابِ بهترین ابزارها برای پروژه‌ هایشان را میدهد.

آغازِ تجربه‌ اندوزی در عرض چند ثانیه: دسترسیِ فوری به Gemma 3 و امکانِ شروعِ بی‌ درنگِ ساختِ کاربردها، از طریقِ Google AI Studio و یا بارگیریِ مدل‌ ها از طریق Kaggle یا Hugging Face، فراهم شده است.

سفارشی‌ سازی Gemma 3 بر اساس نیاز های خاص: Gemma 3 با یک کدبیسِ بازسازی‌شده عرضه شده است که شامل دستورالعمل‌هایی برای تنظیم دقیق (Fine-tuning) و استنتاجِ کارآمد است. توسعه‌دهندگان می‌توانند مدل را با استفاده از پلتفرم‌های دلخواه، مانند Google Colab، Vertex AI و یا حتی GPUهای گیمینگِ خود، آموزش داده و تطبیق دهند.

گزینه‌ های گوناگون برای پیاده‌ سازی: Gemma 3 گزینه‌ های متعددی برای پیاده‌ سازی ارائه می‌دهد، از جمله Vertex AI، Cloud Run، Google GenAI API، محیط‌ های محلی و سایر پلتفرم‌ ها، که به توسعه‌ دهندگان انعطاف‌ پذیریِ لازم برای انتخابِ بهترین گزینه بر اساسِ کاربرد و زیرساختِ خود را میدهد.

عملکردِ بهینه‌ شده بر روی GPUهای NVIDIA: شرکت NVIDIA به طور مستقیم مدل‌ های Gemma 3 را بهینه نموده است تا توسعه‌ دهندگان از حداکثرِ عملکرد بر روی GPUهای مختلف، از Jetson Nano تا جدیدترین تراشه‌ های Blackwell، بهره‌مند گردند. Gemma 3 اکنون در NVIDIA API Catalog نیز موجود است که امکانِ نمونه‌ سازیِ سریع را تنها با یک فراخوانیِ API فراهم می‌سازد.

شتاب‌ دهی به توسعه‌ هوش مصنوعی بر روی پلتفرم‌ های سخت‌ افزاری گوناگون: Gemma 3 همچنین برای Google Cloud TPUs بهینه شده و از طریق پشته‌ متن‌ باز ROCm™ با GPUهای AMD نیز یکپارچه میشود. برای اجرای CPU، Gemma.cpp راهکاری مستقیم ارائه میدهد. های‌ ورت بر این باور است که این سطح از یکپارچگی و دسترس‌ پذیری، Gemma 3 را به ابزاری قدرتمند و همه‌جانبه برای توسعه‌ دهندگان هوش مصنوعی در سراسر جهان بدل خواهد نمود.

Gemmaverse: مجموعه‌ ای گسترده از مدل‌ ها و ابزارهای مبتنی بر Gemma (H2)

Gemmaverse، اکوسیستمی وسیع از مدل‌ ها و ابزارهای مبتنی بر Gemma است که توسط جامعه توسعه‌ دهندگان خلق شده و آماده‌ قدرت‌ بخشی و الهام‌ بخشی به نوآوری‌ های شماست. برای مثال، SEA-LION v3 از AI Singapore، موانع زبانی را درهم شکسته و ارتباطات را در سراسر جنوب شرقی آسیا تسهیل می‌نماید؛ BgGPT از INSAIT، یک مدل زبانی بزرگ پیشگام در زبان بلغاری است که قدرت Gemma را در پشتیبانی از زبان‌ های گوناگون به نمایش میگذارد؛

و OmniAudio از Nexa AI، پتانسیلِ هوش مصنوعیِ روی دستگاه (On-Device AI) را به رخ میکشد و قابلیت‌ های پیشرفته‌ پردازشِ صدا را به دستگاه‌ های روزمره می‌ آورد. به منظورِ تشویقِ بیشترِ دستاوردهای پژوهشیِ دانشگاهی، گوگل برنامه‌ی Gemma 3 Academic Program را راه‌ اندازی نموده است. پژوهشگران دانشگاهی می‌توانند برای دریافتِ اعتباراتِ Google Cloud (به ارزش 10,000 دلار برای هر جایزه) به منظورِ تسریع در پژوهش‌ های مبتنی بر Gemma 3 خود درخواست دهند.

آغاز کار با Gemma 3: درهایِ نوآوری به رویِ همگان گشوده شد

Gemma 3، گامی نوین در راستای تعهدِ مداومِ گوگل به دموکراتیزه‌ سازیِ دسترسی به هوش مصنوعیِ باکیفیت است. اگر مشتاقِ تجربه‌ اندوزی با Gemma 3 هستید، گوگل راه‌ های گوناگونی را برای شما فراهم نموده است:

کاوش فوری:

تجربه‌ Gemma 3 با دقتِ کامل، مستقیماً در مرورگرِ خود - بدون نیاز به تنظیمات - با Google AI Studio.

دریافتِ کلید API به طور مستقیم از Google AI Studio و استفاده از Gemma 3 با Google GenAI SDK.

سفارشی‌ سازی و ساخت:

بارگیریِ مدل‌ های Gemma 3 از Hugging Face، Ollama یا Kaggle.

تنظیم دقیق و تطبیقِ آسانِ مدل با نیازهای منحصر به‌ فردِ خود با کتابخانه‌ Transformers از Hugging Face، یا محیط توسعه‌ دلخواهتان. های‌ورت شما را دعوت مینماید تا با بهره‌ گیری از این امکانات، به جمع نوآوران و خالقانِ کاربردهایِ شگفت‌ انگیزِ هوش مصنوعی بپیوندید.

Gemma 3، پیشگامی گوگل در عصر هوش مصنوعی قابل‌ حمل و متن‌ باز

معرفی Gemma 3، نشان‌ دهنده‌ عزم راسخِ گوگل در جهتِ پیشبردِ مرزهایِ دانشِ هوش مصنوعی و دسترس‌پذیر نمودنِ این فناوریِ تحول‌ آفرین برای همگان است. Gemma 3 با ارائه‌ عملکردی بی‌ن ظیر، کاراییِ مثال‌ زدنی، قابلیت‌ های گسترده و رویکردی مسئولانه در توسعه، نویدبخشِ فصلی نوین در تاریخِ هوش مصنوعی قابل‌ حمل و متن‌ باز است.

کلمات کلیدی: هوش مصنوعی، Gemma 3، گوگل، مدل زبانی، باز، رایگان، قدرتمند، های ورت، تکنولوژی، یادگیری ماشین، ChatGPT، OpenAI، Google AI، عملکرد، سخت‌ افزار، زبان‌ های برنامه‌ نویسی، استدلال متنی، استدلال تصویری، امنیت، رقابت.

مطالب مرتبط

حراج عیدانه های ورت شروع شد! تخفیف‌ های باورنکردنی برای همه دسته‌ ها!

پوست اندازی به سبک نوروز، بهترین روتین شاداب کننده پوست

نوروز در جهان: از ایران تا آن سوی مرزها، جشن بهار به روایت ملل

ساخته عجیب snap chat: لنز های ویدیویی جدید با هوش مصنوعی!