گزارش کامل Google I/O 2025: رونمایی‌ های هوش مصنوعی Gemini، Veo و Flow

چکیده

پوشش جامع و تحلیلی رویداد Google I/O 2025 از های‌ ورت (hiwert.com). با جدیدترین رونمایی‌ های گوگل در هوش مصنوعی شامل Gemini 2.5، Veo 3، Flow، Imagen 4 و اشتراک AI Ultra آشنا شوید.

۱۴۰۴ پنج شنبه ۲ خرداد

گزارش کامل های‌ ورت از رویداد Google I/O 2025؛ مروری بر مهم‌ترین رونمایی‌ های گوگل در حوزه هوش مصنوعی و فناوری.

بازتعریف آینده با هوش مصنوعی: نگاهی جامع به شگفت‌ انگیزترین رونمایی‌ های Google I/O 2025 از قلب های‌ ورت

Google I/O 2025، ویترین جاه‌ طلبی‌ های گوگل در عصر هوش مصنوعی اول (AI-First)

کنفرانس سالانه توسعه‌دهندگان گوگل، Google I/O، همواره یکی از مهم‌ ترین رویدادهای دنیای فناوری بوده است؛ رویدادی که نه تنها جدیدترین دستاوردها و محصولات این غول فناوری را به نمایش می‌گذارد، بلکه چشم‌انداز و مسیر آینده آن را نیز برای توسعه‌دهندگان، کسب‌وکارها و عموم کاربران ترسیم می‌کند. رویداد Google I/O 2025 که در تاریخ ۲۰ و ۲۱ می ۲۰۲۵ (معادل ۳۰ و ۳۱ اردیبهشت ۱۴۰۴) به صورت حضوری در آمفی‌تئاتر شواِلاین و همچنین به طور مجازی برای مخاطبان جهانی برگزار شد، بیش از هر زمان دیگری، صحنه نمایش تعهد عمیق و همه‌جانبه گوگل به هوش مصنوعی (AI) و تلاش بی‌وقفه این شرکت برای ادغام یکپارچه و هوشمندانه آن در سراسر اکوسیستم گسترده محصولات و سرویس‌هایش بود. در این مقاله جامع از های‌ورت (hiwert.com)، قصد داریم به قلب تپنده این رویداد هیجان‌انگیز سفر کنیم و مهم‌ترین رونمایی‌ها، به‌روزرسانی‌ها و چشم‌اندازهای ارائه شده توسط گوگل را با نگاهی تحلیلی و دقیق مورد بررسی قرار دهیم.

مروری بر اهداف، چشم‌اندازها و شعار محوری Google I/O 2025: "از پژوهش به واقعیت" Google I/O 2025 با تمرکزی بی‌سابقه بر توانمندسازی جامعه جهانی توسعه‌دهندگان از طریق ارائه ابزارها، پلتفرم‌ها و مدل‌های نوین هوش مصنوعی برگزار شد. شعار محوری "از پژوهش به واقعیت" (From Research to Reality) به وضوح در بطن تمامی معرفی‌ها و نمایش‌های این کنفرانس منعکس بود. هدف اصلی گوگل، تبدیل دستاوردهای تحقیقاتی پیشرفته و گاه پیچیده در حوزه هوش مصنوعی به محصولاتی کاربردی، قابل دسترس و ارزش‌آفرین برای عموم کاربران و کسب‌وکارهای مختلف در سراسر جهان است. این رویداد نه تنها نمایانگر پیشرفت‌های فناورانه خیره‌کننده گوگل بود، بلکه نشان‌دهنده یک تغییر پارادایم عمیق‌تر و استراتژیک در هویت این غول فناوری به سمت یک شرکت کاملاً "AI-first" (هوش مصنوعی در اولویت) است.

در این پارادایم جدید، هوش مصنوعی دیگر تنها یک ویژگی یا قابلیت جانبی در محصولات گوگل نیست، بلکه به هسته اصلی و نیروی محرکه تمامی نوآوری‌ها و محصولات آینده این شرکت تبدیل شده است. تأکید مکرر بر انتقال سریع و کارآمد از مدل‌های تحقیقاتی به کاربردهای عملی و در دسترس برای میلیاردها کاربر، گواهی بر این مدعاست. گوگل با این رویکرد بلندپروازانه، به دنبال آن است که جستجو، که زمانی محصول اصلی و تعریف‌کننده آن بود، تنها به یکی از نمودهای متعدد و قدرتمند توانمندی‌های هوش مصنوعی این شرکت تبدیل شود.

H3: هوش مصنوعی مولد و عصر دستیارهای هوشمند فوق پیشرفته: تم اصلی و نیروی محرکه کنفرانس هوش مصنوعی مولد (Generative AI) و ظهور نسل جدیدی از دستیارهای هوشمند (AI agents) فوق پیشرفته، به عنوان تم اصلی و نیروی محرکه بلامنازع کنفرانس Google I/O 2025 خودنمایی می‌کردند. گوگل به طور گسترده و با ارائه دموهای متعدد و هیجان‌انگیز، نشان داد که چگونه هوش مصنوعی می‌تواند به شکلی فعال، پیش‌دستانه و بسیار کارآمدتر از گذشته، در انجام وظایف مختلف، از کارهای روزمره گرفته تا پروژه‌های پیچیده خلاقانه و تحقیقاتی، به کاربران یاری رساند. سوندار پیچای، مدیرعامل گوگل، در سخنرانی افتتاحیه خود با تاکید بر اینکه دهه‌ها پژوهش و سرمایه‌گذاری گوگل در زمینه هوش مصنوعی اکنون در حال تبدیل شدن به واقعیت‌های ملموس و تأثیرگذار برای مردم در سراسر جهان است، این چشم‌انداز را تقویت کرد. تأکید بر "دستیارهای هوشمند" در I/O 2025، فراتر از صرفاً بهبود پاسخگویی به دستورات صوتی یا متنی ساده کاربران بود.

گوگل در حال توسعه سیستم‌هایی است که قادرند اهداف پیچیده و چندمرحله‌ای کاربران را درک کرده، برای رسیدن به آن‌ها برنامه‌ریزی کنند و در چندین مرحله و از طریق تعامل با برنامه‌های کاربردی مختلف، اقدامات لازم را به طور هوشمندانه به انجام رسانند. این رویکرد، گامی بلند به سوی تحقق هوش مصنوعی واقعاً یاری‌رسان، زمینه‌آگاه و تا حدی مستقل محسوب می‌شود. معرفی پروژه‌هایی مانند Project Mariner به عنوان یک عامل پژوهشی با قابلیت انجام وظایف متعدد در وب، قابلیت‌های Agent Mode در اپلیکیشن Gemini برای انجام اموری چون رزرو سفر یا جستجوی آپارتمان، و ادغام قابلیت‌های عاملیتی در جستجوی گوگل (AI Mode) برای کمک به فرآیندهای پیچیده‌ای مانند خرید آنلاین و برنامه‌ریزی سفر، همگی نشان‌دهنده این جهت‌گیری استراتژیک و آینده‌نگرانه هستند.

گوگل دیگر تنها به دنبال ارائه سریع اطلاعات نیست، بلکه می‌خواهد به طور فعال و هوشمندانه به کاربران در به سرانجام رساندن وظایف و دستیابی به اهدافشان کمک کند. رشد تصاعدی و خیره‌کننده پردازش توکن‌ها توسط مدل‌های گوگل، از ۹.۷ تریلیون توکن در ماه به ۴۸۰ تریلیون توکن در ماه، و همچنین افزایش پنج برابری تعداد توسعه‌دهندگان فعال بر روی پلتفرم Gemini تنها از سال گذشته، نشان‌دهنده سرعت بالای پذیرش، مقیاس‌پذیری چشمگیر و قدرت روزافزون زیرساخت هوش مصنوعی گوگل است. این ارقام نه تنها بیانگر توان فنی بی‌بدیل گوگل در مدیریت این حجم عظیم از پردازش و داده هستند، بلکه زمینه را برای نوآوری‌های سریع‌تر، پیچیده‌تر و تأثیرگذارتر در آینده نزدیک فراهم می‌کنند. این توانایی در مدیریت مقیاس، یک مزیت رقابتی کلیدی و استراتژیک برای گوگل در رقابت نفس‌گیر هوش مصنوعی به شمار می‌رود و نشان می‌دهد که این شرکت برای پشتیبانی از موج بعدی برنامه‌های کاربردی و سرویس‌های مبتنی بر هوش مصنوعی کاملاً آماده و مجهز است.

اکوسیستم قدرتمند Gemini: پیشران اصلی نوآوری‌های هوش مصنوعی گوگل در I/O 2025

خانواده مدل‌های هوش مصنوعی Gemini، به عنوان قلب تپنده استراتژی AI-first گوگل، در مرکز بسیاری از رونمایی‌های Google I/O 2025 قرار داشتند. این شرکت از به‌روزرسانی‌های قابل توجهی برای این مدل‌ها و همچنین قابلیت‌های جدیدی برای توسعه‌دهندگان و کاربران نهایی پرده‌برداری کرد.

به‌روزرسانی‌ های کلیدی و چشمگیر برای خانواده مدل‌های پیشرفته Gemini (شامل Gemini 2.5 Pro و Flash) در Google I/O 2025، گوگل از به‌روزرسانی‌ های قابل توجهی برای مدل‌های پرچمدار خود، به ویژه Gemini 2.5 Pro و Gemini 2.5 Flash، رونمایی کرد. این به‌روزرسانی‌ها بر بهبود عملکرد در زمینه‌هایی چون کدنویسی پیشرفته، استدلال پیچیده و چندمرحله‌ای، و همچنین بهینه‌سازی برای سرعت، کارایی و کاهش هزینه‌ها متمرکز بودند. گوگل تاکید کرد که این مدل‌ها اکنون قادرند وظایف پیچیده‌تری را با دقت و سرعت بیشتری انجام دهند و به توسعه‌دهندگان امکان می‌دهند تا اپلیکیشن‌های هوشمند قدرتمندتری بسازند.

قابلیت‌های پیشرفته و منحصربه‌فرد استدلال با حالت "Deep Think" در Gemini 2.5 Pro: یکی از برجسته‌ترین و شاید بتوان گفت، انقلابی‌ترین معرفی‌ها در این بخش، حالت استدلال پیشرفته "Deep Think" برای مدل Gemini 2.5 Pro بود. این حالت که از جدیدترین تکنیک‌ها و دستاوردهای پژوهشی گوگل در زمینه تفکر، برنامه‌ریزی و استدلال عمیق بهره می‌برد، به مدل امکان می‌دهد تا پیش از ارائه پاسخ نهایی، چندین فرضیه و مسیر راه‌حل ممکن را مورد بررسی و ارزیابی قرار دهد. Deep Think به طور خاص برای موارد استفاده بسیار پیچیده مانند حل مسائل ریاضی سطح بالا، کدنویسی پیشرفته و وظایف نیازمند استدلال چندمرحله‌ای طراحی شده است و توانسته در بنچمارک‌های دشوار و معتبری نظیر UAMO امتیازات قابل توجه و رکوردشکنی کسب کند. معرفی Deep Think نشانگر حرکت بلندپروازانه گوگل به سمت توسعه مدل‌هایی با قابلیت "تفکر" عمیق‌تر و فرآیندهای شناختی شبیه‌تر به انسان است؛ فراتر از صرفاً تطبیق الگو یا بازیابی اطلاعات، و به سمت تولید دانش، خلاقیت و ارائه راه‌حل‌های نوآورانه برای مسائل بسیار پیچیده.

خروجی صوتی بومی (Native Audio Output) و قابلیت‌های چندوجهی گسترش‌یافته: مدل‌های Gemini 2.5 Pro و Flash اکنون از قابلیت "خروجی صوتی بومی" از طریق Live API پشتیبانی می‌کنند. این ویژگی پیشرفته امکان تولید گفتاری بسیار طبیعی، روان و انسانی را با قابلیت کنترل دقیق و دانه‌ای بر لحن، لهجه، سبک بیان و حتی احساسات صدا فراهم می‌آورد. نکته قابل توجه دیگر، پشتیبانی این مدل‌ها برای اولین بار از چند گوینده (تا دو صدای مجزا و قابل تفکیک) و همچنین قابلیت تغییر زبان یکپارچه (Seamless Language Switching) در بیش از ۲۴ زبان مختلف در حین مکالمه یا تولید محتوای صوتی است. این قابلیت‌های صوتی پیشرفته، مرزهای جدیدی را برای توسعه اپلیکیشن‌های محاوره‌ای، دستیارهای صوتی هوشمند، ابزارهای یادگیری زبان، تولید محتوای چندرسانه‌ای جهانی و تجربه‌های کاربری فراگیر باز می‌کند.

بودجه‌ های تفکر (Thinking Budgets) و خلاصه‌ های تفکر (Thought Summaries) برای توسعه‌ دهندگان: برای جامعه توسعه‌دهندگان، گوگل قابلیت نوآورانه "Thinking Budgets" را برای مدل‌های Gemini 2.5 Pro و Flash معرفی کرد. این ویژگی به توسعه‌دهندگان این امکان را می‌دهد تا با ایجاد یک تعادل هوشمندانه بین میزان تأخیر (Latency) و کیفیت خروجی نهایی، هزینه‌های استفاده از مدل را به طور موثرتری کنترل و بهینه کنند. علاوه بر این، قابلیت "Thought Summaries" فرآیند فکری، مراحل استدلال و زنجیره تصمیم‌گیری مدل را به شکلی واضح، ساختاریافته و قابل فهم نمایش می‌دهد. این شفافیت، فرآیند اعتبارسنجی پاسخ‌ها و اشکال‌زدایی (Debugging) وظایف پیچیده هوش مصنوعی را برای توسعه‌دهندگان به طور قابل توجهی تسهیل و تسریع می‌بخشد. این ویژگی‌ها نشان‌دهنده بلوغ روزافزون پلتفرم Gemini و تمرکز گوگل بر ارائه ابزارهای عملی، کارآمد و قابل کنترل برای توسعه‌دهندگان، به ویژه در سطح سازمانی و برای کاربردهای تجاری است.

معرفی و بازنگری در اشتراک‌ های جدید و پرمیوم Google AI: طرح‌های Pro و Ultra برای کاربران حرفه‌ای گوگل ساختار اشتراک سرویس‌های هوش مصنوعی خود را با معرفی دو سطح پولی جدید و قدرتمند بازنگری و گسترش داد: Google AI Pro که جایگزین طرح AI Premium سابق شده و با قیمت ماهانه ۱۹.۹۹ دلار عرضه می‌شود، و طرح فوق پیشرفته Google AI Ultra که با قیمت ماهانه ۲۴۹.۹۹ دلار (پس از اعمال تخفیف ۵۰ درصدی برای سه ماه اول در ایالات متحده برای کاربران جدید) برای کاربران بسیار حرفه‌ای و سازمان‌هایی که به بالاترین سطح از توانمندی‌های AI گوگل نیاز دارند، در نظر گرفته شده است. برای اطلاعات بیشتر در مورد این اشتراک جامع، می‌توانید به مقاله اختصاصی های‌ورت با عنوان "[اشتراک Google AI Ultra گوگل: ۲۵۰ دلار برای بهترین هوش مصنوعی و امکانات پرمیوم]([ به مقاله AI Ultra در های‌ ورت])" مراجعه کنید.

به طور خلاصه، اشتراک Google AI Pro شامل دسترسی به اپلیکیشن Gemini (همراه با مدل Gemini 2.5 Pro، قابلیت Deep Research و Veo 2)، ابزار فیلم‌سازی Flow، محدودیت‌های بالاتر برای ابزار تبدیل تصویر به ویدیو Whisk، پلتفرم NotebookLM، ادغام Gemini در سرویس‌هایی نظیر Gmail، Docs و Vids، دسترسی اولیه به Gemini در مرورگر کروم و ۲ ترابایت فضای ذخیره‌سازی ابری است. در مقابل، اشتراک Google AI Ultra بالاترین سطح دسترسی و بیشترین محدودیت‌های استفاده را در قابلیت Deep Research، تولید ویدیو با Veo 2 و دسترسی زودهنگام به مدل پیشگامانه Veo 3 با قابلیت تولید صدای بومی ارائه می‌دهد. علاوه بر این، این طرح شامل ۳۰ ترابایت فضای ذخیره‌سازی، ابزار فیلم‌سازی Flow و دسترسی به Project Mariner، نمونه اولیه یک عامل پژوهشی هوشمند، و همچنین اشتراک YouTube Premium می‌باشد. معرفی سطح Ultra با این قیمت و امکانات، نشان‌دهنده استراتژی گوگل برای هدف قرار دادن بخش حرفه‌ای بازار و کسب درآمد از سرمایه‌گذاری‌های عظیم خود در تحقیق و توسعه هوش مصنوعی است.

Gemini Live: دستیار صوتی هوشمندتر، تعاملی‌تر و اکنون رایگان برای همگان! Gemini Live، تجربه مکالمه صوتی پیشرفته با دستیار هوش مصنوعی گوگل، اکنون به صورت رایگان برای تمامی کاربران در دسترس قرار گرفته است. این قابلیت برجسته، امکان برقراری مکالمات روان، طبیعی و بسیار پویاتر با Gemini را فراهم می‌آورد. ویژگی‌های کلیدی آن شامل امکان استفاده از دوربین گوشی هوشمند برای استخراج اطلاعات از محیط اطراف در زمان واقعی و همچنین قابلیت اشتراک‌گذاری صفحه نمایش با Gemini برای دریافت راهنمایی و تحلیل محتوای بصری است. مهم‌تر آنکه، این ویژگی اکنون به آیفون‌های سازگار نیز گسترش یافته و طیف وسیع‌تری از کاربران را در پلتفرم‌های مختلف پوشش می‌دهد. علاوه بر این، قابلیت‌های کلیدی پروژه پیشرفته Project Astra (که در ادامه به آن خواهیم پرداخت)، نظیر استفاده هوشمندانه از دوربین و امکان اشتراک‌گذاری یکپارچه صفحه، اکنون در Gemini Live نیز ادغام شده‌اند. رایگان شدن Gemini Live و گسترش آن به پلتفرم iOS، نشان‌ دهنده تلاش جدی گوگل برای افزایش نفوذ دستیار هوشمند Gemini و رقابت مستقیم با سایر دستیارهای صوتی مطرح در بازار، با ارائه قابلیت‌های تعاملی و چندوجهی پیشرفته‌تر است.

ادغام عمیق و گسترده Gemini در محصولات کلیدی گوگل: از مرورگر کروم تا مجموعه Workspace و فراتر از آن هوش مصنوعی Gemini به طور فزاینده‌ای در حال ادغام با تار و پود محصولات و سرویس‌های مختلف گوگل است تا تجربه‌ای هوشمندتر و یکپارچه‌ تر را برای کاربران فراهم آورد. در مرورگر کروم دسکتاپ، این قابلیت اکنون برای مشترکین طرح‌های AI Pro و Ultra در دسترس قرار گرفته و به آن‌ها امکان می‌دهد تا از Gemini برای درک و توضیح اطلاعات پیچیده موجود در صفحات وب یا خلاصه‌سازی سریع و کارآمد محتوای آنلاین استفاده کنند. در سرویس Gmail نیز، ویژگی محبوب پاسخ‌های هوشمند (Smart Replies) با بهره‌گیری از قدرت Gemini به طور قابل توجهی شخصی‌ سازی شده‌ اند.

این سیستم اکنون قادر است با تحلیل هوشمندانه صندوق ورودی و حتی محتوای Google Drive کاربر (با رعایت کامل حریم خصوصی)، پاسخ‌هایی را پیشنهاد دهد که از نظر لحن، سبک نگارش و زمینه گفتگو، تطابق بسیار بیشتری با شیوه معمول و ترجیحات ارتباطی خود کاربر داشته باشند. مجموعه Google Workspace (شامل Docs، Sheets، Slides و Vids) نیز شاهد به‌روزرسانی‌های قابل توجهی با محوریت هوش مصنوعی و ادغام عمیق‌تر با Gemini خواهد بود که کارایی، خلاقیت و هوشمندی این ابزارهای بهره‌وری را به سطح جدیدی ارتقا می‌بخشد. این استراتژی ادغام گسترده، که می‌توان آن را "هوش مصنوعی محیطی" (Ambient AI) نامید، هوش مصنوعی را به بخشی جدایی‌ناپذیر و نامحسوس از تجربه روزمره میلیاردها کاربر تبدیل کرده و پتانسیل افزایش بهره‌وری و وفاداری به اکوسیستم گوگل را به همراه دارد.

تحول بنیادین در جستجو و شیوه تعامل ما با اطلاعات: از بازیابی لینک تا دستیاری هوشمند

گوگل در I/O 2025 نشان داد که آینده جستجو، فراتر از ارائه لیستی از لینک‌ها خواهد بود و به سمت یک تجربه محاوره‌ای، تحلیلی و اقدام‌محور حرکت می‌کند.

معرفی رسمی AI Mode در جستجوی گوگل: تجربه‌ ای محاوره‌ ای، عمیق و پاسخ‌ هایی جامع‌ تر از همیشه گوگل از قابلیت جدید و هیجان‌انگیزی تحت عنوان "AI Mode" در موتور جستجوی خود رونمایی کرد که هدف آن ارائه تجربه جستجویی بسیار پویاتر، محاوره‌ای‌تر و ارائه پاسخ‌هایی جامع و چندوجهی به کاربران است. این حالت جدید قادر است سوالات پیچیده، چندبخشی و حتی سوالات تکمیلی و پیگیری‌کننده کاربران را به خوبی مدیریت کند. AI Mode برای یافتن پاسخ‌ها به منابع عمیق‌تر و متنوع‌تری نسبت به جستجوی سنتی رجوع کرده و بنا بر ادعای گوگل، صحت و اعتبار پاسخ‌های خود را نیز با دقت مورد بررسی قرار می‌دهد تا از ارائه اطلاعات نادرست یا "توهمات هوش مصنوعی" (AI Hallucinations) تا حد امکان جلوگیری شود. این قابلیت از هفته برگزاری کنفرانس برای تمامی کاربران در ایالات متحده آمریکا عرضه شده و مدل پیشرفته Gemini 2.5 نیز برای پشتیبانی از AI Mode و همچنین قابلیت AI Overviews در این کشور فعال گردیده است.

قابلیت‌های پیشرفته و شگفت‌انگیز: از خلاصه‌سازی هوشمند تا تحلیل داده و بصری‌سازی اطلاعات: AI Mode تنها به ارائه پاسخ‌های متنی خلاصه نمی‌شود. این حالت جدید توانایی خلاصه‌سازی هوشمندانه اطلاعات از منابع متعدد، تحلیل داده‌های پیچیده (به عنوان مثال، داده‌های آماری ورزشی یا اطلاعات مالی و بورسی) و نمایش یافته‌ها و نتایج در قالب نمودارها، جداول و چارت‌های تولید شده توسط هوش مصنوعی را داراست. علاوه بر این، قابلیت Deep Search نیز برای ارائه پاسخ‌های بسیار عمیق‌تر، پژوهش‌محورتر و با جزئیات بیشتر، در بخش Labs جستجوی گوگل در دسترس کاربران قرار خواهد گرفت. این تحول بنیادین در جستجو، آن را از یک ابزار صرفاً برای بازیابی لینک‌ها، به یک دستیار تحلیلی، بصری و حتی برنامه‌ریز تبدیل می‌کند. گوگل با این اقدام، قصد دارد کاربران را برای مدت زمان طولانی‌تری در پلتفرم خود نگه دارد و نیاز آن‌ها به مراجعه به وب‌سایت‌های متعدد برای یافتن و ترکیب اطلاعات کامل را به طور قابل توجهی کاهش دهد. این رویکرد، بدون شک می‌تواند مدل کسب‌وکار فعلی گوگل که بخش زیادی از آن مبتنی بر کلیک روی تبلیغات در صفحات نتایج جستجو است و همچنین میزان ترافیک ارگانیک وب‌سایت‌های دیگر را در آینده تحت تأثیر قرار دهد.

Search Live: جستجوی بصری، آنی و تعاملی با قدرت شگفت‌انگیز پروژه پیشرفته Project Astra قابلیت نوآورانه Search Live که در تابستان برای کاربران عرضه خواهد شد، به آن‌ها اجازه می‌دهد تا با استفاده از دوربین گوشی هوشمند خود، به صورت زنده، در لحظه و کاملاً تعاملی با موتور جستجوی گوگل در مورد آنچه مشاهده می‌کنند، به گفتگو بپردازند. این ویژگی پیشگامانه از توانمندی‌های پروژه فوق پیشرفته Project Astra (که در ادامه بیشتر به آن می‌پردازیم) بهره می‌برد. Search Live مرز میان دنیای فیزیکی و دیجیتال را بیش از پیش کمرنگ ساخته و فرآیند جستجو را به تجربه‌ای کاملاً وابسته به زمینه، محیط اطراف و تعامل بصری کاربر تبدیل می‌کند. این قابلیت، پتانسیل بسیار زیادی در حوزه‌هایی نظیر آموزش تعاملی، خرید آنلاین هوشمند، راهنمای گردشگری و ترجمه زنده متون و اشیاء در محیط واقعی دارد و می‌تواند نحوه تعامل ما با اطلاعات مربوط به اشیاء، مکان‌ها و محیط پیرامونمان را به کلی دگرگون سازد.

Project Astra: چشم‌انداز بلندپروازانه گوگل برای خلق یک دستیار جهانی، یکپارچه و همه‌ فن‌ حریف هوش مصنوعی گوگل در رویداد I/O 2025، پیشرفت‌های بیشتری را در Project Astra، پروژه بسیار بلندپروازانه خود برای ساخت یک دستیار جهانی و چندوجهی هوش مصنوعی، به نمایش گذاشت. دموهای ارائه‌شده، قابلیت‌های پیشرفته این دستیار در درک زمینه‌های پیچیده بصری و صوتی، به خاطر سپردن اطلاعات قبلی، و توانایی آن برای اقدام فعال و پیش‌دستانه در دستگاه‌های مختلف کاربر (از گوشی هوشمند گرفته تا عینک‌های هوشمند آینده) را به تصویر کشیدند. همانطور که پیشتر اشاره شد، قابلیت‌های کلیدی Project Astra، نظیر استفاده هوشمندانه از دوربین و امکان اشتراک‌گذاری یکپارچه صفحه، اکنون در Gemini Live نیز ادغام شده‌اند. Project Astra نشان‌دهنده جاه‌طلبی گوگل برای ایجاد یک دستیار هوش مصنوعی یکپارچه، همه‌جانبه و واقعاً مفید است که می‌تواند در تمامی جنبه‌های زندگی دیجیتال و حتی فیزیکی کاربر حضور داشته باشد و به طور هوشمندانه به او در انجام امور مختلف، از برنامه‌ریزی روزانه گرفته تا حل مسائل پیچیده، یاری رساند. موفقیت این پروژه می‌تواند تعریف جدیدی از تعامل انسان و کامپیوتر ارائه دهد و راه را برای دستیارهای هوش مصنوعی مرکزی که قادر به هماهنگ‌سازی وظایف در سراسر اکوسیستم یک شرکت و حتی فراتر از آن هستند، هموار سازد.

Project Mariner: دستیار هوشمند و عامل پژوهشی گوگل برای انجام وظایف متعدد و پیچیده در محیط وب Project Mariner به عنوان یک نمونه اولیه از یک عامل پژوهشی (Research Agent) با هدف کمک به کاربران در انجام وظایف زمان‌بر اما نسبتاً ساده در محیط گسترده وب معرفی شد. این دستیار هوشمند و عامل‌محور (Agentic) قادر است تا ۱۰ وظیفه را به طور همزمان مدیریت کند و در اموری مانند جستجوی اطلاعات از منابع متعدد، انجام رزروهای سفر و هتل، خرید آنلاین محصولات و اجرای تحقیقات اولیه به کاربران یاری رساند. دسترسی به Project Mariner در ابتدا محدود به مشترکین طرح Google AI Ultra در ایالات متحده خواهد بود، اما گوگل اعلام کرده که قابلیت‌های آن در آینده به Gemini API و پلتفرم Vertex AI نیز افزوده خواهد شد تا توسعه‌دهندگان بتوانند عامل‌های مشابهی را برای کاربردهای خاص خود ایجاد کنند. Project Mariner گام مهمی به سوی تحقق دستیارهای هوش مصنوعی است که می‌توانند به طور مستقل و با حداقل نظارت کاربر، در وبگردی، جمع‌آوری اطلاعات و انجام تراکنش‌های آنلاین به او کمک کنند. این فناوری پتانسیل دگرگونی کامل نحوه تعامل ما با خدمات آنلاین را دارد، اما در عین حال، سوالات مهمی را نیز در مورد امنیت داده‌ها، حفظ حریم خصوصی کاربران و نیاز به چارچوب‌های نظارتی برای عملکرد این عامل‌های هوشمند مطرح می‌کند.

نوآوری‌ های شگفت‌ انگیز در خرید آنلاین: از پرو مجازی لباس با هوش مصنوعی تا فرآیند پرداخت هوشمند و خودکار گوگل در رویداد I/O 2025، تجربه خرید آنلاین جدید و بسیار پیشرفته‌ای را در بستر AI Mode موتور جستجوی خود معرفی کرد که با بهره‌گیری از تصاویر الهام‌بخش، راهنمایی هوشمند مبتنی بر سلیقه کاربر و داده‌های محصول قابل اعتماد، فرآیند کشف و خرید آنلاین محصولات را متحول می‌سازد. یکی از برجسته‌ترین و جذاب‌ترین ویژگی‌های این تجربه جدید، قابلیت "Try On" (پرو مجازی) است که به کاربران اجازه می‌دهد تنها با آپلود یک عکس از خود یا انتخاب یک مدل با مشخصات بدنی مشابه، میلیاردها قلم لباس مختلف از برندهای گوناگون را به صورت مجازی بر تن خود مشاهده کنند و تناسب و ظاهر آن را ارزیابی نمایند. علاوه بر این، یک قابلیت پرداخت هوشمند و عامل‌محور (Agentic Checkout) نیز برای کمک به کاربران در انجام خرید با بهترین قیمت و به ساده‌ترین شکل ممکن معرفی شد. این سیستم شامل امکاناتی نظیر ردیابی قیمت محصولات در فروشگاه‌های مختلف، اعمال خودکار کدهای تخفیف موجود و تکمیل خودکار فرآیند پرداخت با استفاده از Google Pay است. این نوآوری‌ها، خرید آنلاین را به تجربه‌ای بسیار شخصی‌تر، تعاملی‌تر، سرگرم‌کننده‌تر و کارآمدتر تبدیل می‌کنند و پتانسیل آن را دارند که نرخ تبدیل را برای فروشندگان آنلاین به طور قابل توجهی افزایش دهند. با این حال، جمع‌آوری و پردازش داده‌های مربوط به مشخصات بدنی، سلیقه و ترجیحات خرید کاربران، نگرانی‌های مربوط به حفظ حریم خصوصی و امنیت داده‌ها را بیش از پیش تشدید می‌کند و نیازمند شفافیت و کنترل کامل کاربر بر داده‌های خود می‌باشد.

انقلاب در تولید محتوای چندرسانه‌ای خلاقانه و حرفه‌ای با هوش مصنوعی گوگل

گوگل در I/O 2025 نشان داد که هوش مصنوعی مولد نه تنها در درک و پردازش محتوا، بلکه در خلق محتوای چندرسانه‌ای با کیفیت بالا نیز به پیشرفت‌های چشمگیری دست یافته است.

Imagen 4: نسل جدید و قدرتمند تولید تصویر از متن با قابلیت بی‌نظیر رندر دقیق متن در تصاویر گوگل از Imagen 4، نسخه جدید، بهبودیافته و بسیار قدرتمندتر مدل تولید تصویر از متن خود، رونمایی کرد. این نسخه با کیفیت تصویر ارتقاء یافته، درک بهتر از پرامپت‌های پیچیده و سرعت پردازش بالاتری نسبت به نسل‌های قبلی عرضه شده است. اما پیشرفت چشمگیر و کلیدی Imagen 4، توانایی منحصربه‌فرد آن در مدیریت صحیح کاراکترها و رندر دقیق، خوانا و طبیعی متن در داخل تصاویر تولید شده است. این مدل اکنون می‌تواند متن را با قالب‌بندی صحیح و در مکان‌های منطقی و معقول درون تصویر، به گونه‌ای که با سایر عناصر بصری هماهنگ باشد، تولید کند. Imagen 4 به عنوان بخشی از ابزار فیلم‌سازی هوش مصنوعی Google Flow (که در ادامه به آن می‌پردازیم) نیز ادغام شده است. برای آشنایی بیشتر با این مدل تصویرساز شگفت‌انگیز، می‌توانید به مقاله اختصاصی های‌ورت با عنوان "[معرفی گوگل Imagen 4: بهترین مدل تصویرساز AI برای مهندسی خلاقیت]([لینک به مقاله Imagen 4 در های‌ورت])" مراجعه کنید. این پیشرفت، Imagen 4 را برای کاربردهای عملی‌تر در طراحی گرافیک، تبلیغات، تولید محتوای آموزشی و بازاریابی بسیار مناسب‌تر از گذشته می‌کند.

Veo 3: تولید ویدیوهای فوق‌العاده واقع‌گرایانه با قابلیت نوین و انقلابی "تولید صدای بومی" و همزمان Veo 3، جدیدترین و پیشرفته‌ترین مدل تولید ویدیوی گوگل، با بهبودهای قابل توجهی در کیفیت بصری، درک بهتر از قوانین فیزیک، حرکت طبیعی و پیوستگی صحنه‌ها، و مهم‌تر از همه، با قابلیت نوین و انقلابی "تولید صدای بومی" (Native Audio Generation) معرفی شد. این قابلیت شگفت‌انگیز به معنای تولید خودکار و همزمان صداهای محیطی، افکت‌های صوتی و حتی دیالوگ شخصیت‌ها به طور مستقیم و یکپارچه در فرآیند ساخت ویدیو توسط هوش مصنوعی است؛ امری که پیش از این نیازمند مراحل جداگانه، پیچیده و پرهزینه صدابرداری و صداگذاری بود. Veo 3 نیز همانند Imagen 4، در پلتفرم فیلم‌سازی پیشرفته Google Flow ادغام شده و دسترسی اولیه به آن، به ویژه قابلیت تولید صدای بومی، برای مشترکین طرح Google AI Ultra فراهم گردیده است. برای کسب اطلاعات تکمیلی در مورد این مدل ویدیوساز پیشگام، مطالعه مقاله های‌ورت با عنوان "[هوش مصنوعی گوگل Veo 3 معرفی شد، با قابلیت افزودن صدا به ویدیو]([لینک به مقاله Veo 3 در های‌ورت])" را به شما پیشنهاد می‌کنیم. تولید همزمان ویدیو و صدای بومی یک جهش کوانتومی در ابزارهای تولید محتوای مبتنی بر هوش مصنوعی محسوب می‌شود و می‌تواند آینده فیلم‌سازی و تولید محتوای ویدیویی را دگرگون سازد.

Google Flow: رونمایی از پلتفرم فیلم‌سازی جامع و یکپارچه مبتنی بر هوش مصنوعی برای خالقان محتوا Google Flow به عنوان یک ابزار فیلم‌سازی نوین، قدرتمند و جامع مبتنی بر هوش مصنوعی معرفی شد که برای بهره‌گیری از تمام توانمندی‌های مدل‌های پیشرفته Veo (برای ویدیو)، Imagen (برای تصویر) و Gemini (برای درک پرامپت و منطق) طراحی و توسعه یافته است. هدف اصلی Flow، کمک به داستان‌نویسان، فیلم‌سازان و تمامی خالقان محتوا برای کشف و پرورش ایده‌های خلاقانه خود بدون محدودیت‌های فنی و تولید کلیپ‌ها، سکانس‌ها و صحنه‌های سینمایی با کیفیت برای روایت داستان‌هایشان است. جزئیات بیشتر در مورد این ابزار هیجان‌انگیز را می‌توانید در مقاله اختصاصی های‌ورت با عنوان "[ابزار فیلمسازی Flow گوگل با هوش مصنوعی: تولید فیلم سینمایی با Veo و Imagen]([لینک به مقاله Flow در های‌ورت])" مطالعه فرمایید. Flow با ارائه کنترل‌های پیشرفته دوربین، ابزار Scenebuilder برای ویرایش و گسترش نماها، و دسترسی به کتابخانه محتوای Flow TV، فرآیند فیلم‌سازی را دموکراتیزه کرده و به موج جدیدی از خلاقیت در میان تولیدکنندگان محتوا دامن می‌زند.

H3: NotebookLM: یادداشت‌برداری هوشمند با قابلیت‌های جدید و شگفت‌انگیز خلاصه‌سازی ویدیویی و صوتی NotebookLM، اپلیکیشن یادداشت‌برداری و پژوهشی مبتنی بر هوش مصنوعی گوگل، با افزودن قابلیت‌های جدید و بسیار کاربردی، از جمله امکان تولید خلاصه‌های ویدیویی از اسناد (Video Overviews) و همچنین خلاصه‌های صوتی (Audio Overviews) به‌روزرسانی شد. این ویژگی به کاربران اجازه می‌دهد تا منابع مختلفی، از جمله ویدیوهای یوتیوب (به عنوان مثال، سخنرانی‌های کلیدی رویداد I/O 2025)، لینک‌های وبلاگ‌ها و اطلاعیه‌های مطبوعاتی را در NotebookLM بارگذاری کرده و از این ابزار برای درک بهتر، عمیق‌تر و سریع‌تر اخبار و اطلاعات رویداد استفاده کنند. کاربران می‌توانند از طریق یک نقشه ذهنی (Mind Map) پویا، بخش پرسش و پاسخ (FAQ) تولید شده توسط AI یا یک نمای کلی صوتی (Audio Overview) به کاوش در معرفی‌ های Google I/O بپردازند و یا سوالات مشخصی مانند "مهم‌ترین معرفی‌های اندروید در I/O 2025 چه بودند؟" را از NotebookLM بپرسند و خلاصه‌هایی در فرمت‌های مختلف، مثلاً "یک پست اجتماعی در مورد آخرین اخبار Gemini برای من پیش‌نویس کن"، دریافت نمایند. این قابلیت‌ها، NotebookLM را به ابزاری بی‌نظیر و قدرتمند برای پژوهشگران، دانشجویان، روزنامه‌نگاران و هر کسی که با حجم زیادی از اطلاعات متنی و چندرسانه‌ای سروکار دارد، تبدیل می‌کند.

پیشرفت‌های چشمگیر و نوآورانه در پلتفرم اندروید و اکوسیستم گسترده و پویای آن

گوگل در I/O 2025 نشان داد که به توسعه و ارتقای پلتفرم اندروید و اکوسیستم آن، با تمرکز ویژه بر هوش مصنوعی و تجارب کاربری نوین، ادامه می‌دهد.

Android XR: ادغام واقعیت توسعه‌یافته (XR) با هوش مصنوعی قدرتمند و چندوجهی Gemini گوگل در این رویداد تأکید ویژه‌ای بر پیشرفت‌های پلتفرم Android XR داشت که برای نسل جدید هدست‌های واقعیت مجازی (VR) و عینک‌های واقعیت افزوده (AR) طراحی شده است. نسخه Developer Preview 2 برای Android XR SDK منتشر شد و خبر از گسترش اکوسیستم دستگاه‌های سازگار، از جمله هدست بسیار مورد انتظار Project Moohan سامسونگ که اواخر سال جاری میلادی عرضه می‌شود، داده شد.

گوگل همچنین همکاری نزدیک خود را با سامسونگ در زمینه توسعه این هدست، که به عنوان رقیبی جدی برای Apple Vision Pro مطرح است، رسماً تأیید کرد. دموهای ارائه‌شده از عینک‌های هوشمند مجهز به هوش مصنوعی Gemini، قابلیت‌های شگفت‌انگیزی نظیر نمایش پیام‌ها و نوتیفیکیشن‌ها به صورت شناور در میدان دید، شناسایی هوشمند سوژه‌ها و اشیاء در عکس‌ها، به خاطر سپردن مکان‌های بازدید شده قبلی (مانند یک کافی‌شاپ خاص)، ارائه مسیرهای پیاده‌روی به صورت واقعیت افزوده، و ایجاد رویدادهای تقویم همراه با دعوت از دیگران را به نمایش گذاشت.

این عینک‌ها با گوشی هوشمند کاربر کار می‌کنند و دسترسی به اپلیکیشن‌ها و اطلاعات را بدون نیاز به استفاده از دست و با تعامل صوتی یا حرکتی فراهم می‌آورند و Gemini را مستقیماً به میدان دید و تجربه روزمره کاربر می‌آورند. برندهای مطرح عینک‌سازی مانند Gentle Monster و Warby Parker به عنوان اولین شرکا برای عرضه عینک‌هایی مبتنی بر Android XR معرفی شدند و سامسونگ نیز در آینده نزدیک به این جمع خواهد پیوست. شرکت Xreal نیز از Project Aura، دومین دستگاه رسمی مبتنی بر Android XR که یک عینک واقعیت افزوده سبک و متصل به سیم است، رونمایی کرد. این عینک‌ها از چیپست قدرتمند Qualcomm Snapdragon XR بهره می‌برند و با هوش مصنوعی Gemini یکپارچه شده‌اند. این سرمایه‌گذاری مجدد و گسترده گوگل در حوزه XR، پس از تجربیات قبلی مانند Google Glass، نشان‌دهنده باور عمیق این شرکت به پتانسیل عظیم ترکیب واقعیت توسعه‌یافته با هوش مصنوعی پیشرفته Gemini برای ایجاد تجارب کاربری کاملاً جدید و متحول‌کننده است.

H3: Material 3 Expressive: زبان طراحی جدید، پویاتر، زنده‌تر و شخصی‌سازی‌شده‌تر برای اکوسیستم گوگل گوگل از Material 3 Expressive، نسخه جدید، بهبودیافته و بسیار پر جنب و جوش‌تر زبان طراحی خود، رونمایی کرد. هدف اصلی از این به‌روزرسانی، ارائه جلوه‌های بصری غنی‌تر، پالت‌های رنگی گسترده‌تر و شخصی‌سازی‌شده‌تر، و انیمیشن‌ها و حرکت‌های روان‌تر و پویاتر برای رابط‌های کاربری در سراسر پلتفرم‌های اندروید، Wear OS و مجموعه گسترده اپلیکیشن‌های گوگل است. این زبان طراحی جدید بر ایجاد تجربه‌های کاربری که نه تنها زیبا و کارآمد هستند، بلکه احساسی‌تر، پویاتر و جذاب‌تر نیز باشند، تأکید دارد و به توسعه‌دهندگان امکان می‌دهد تا اپلیکیشن‌هایی با هویت بصری منحصربه‌فردتر و هماهنگ‌تر با قابلیت‌های هوشمند جدید خلق کنند.

Wear OS 6: گامی بلند و مهم به جلو برای دستگاه‌های پوشیدنی هوشمند گوگل و شرکای آن آخرین نسخه سیستم‌عامل دستگاه‌های پوشیدنی گوگل، یعنی Wear OS 6، به طور رسمی در I/O 2025 معرفی شد. این نسخه جدید، زبان طراحی مدرن و پویای Material 3 Expressive را به طور برجسته و کامل در خود جای داده و همچنین کتابخانه‌های جدید و کارآمدی از مجموعه Jetpack را برای ساده‌سازی و تسریع فرآیند توسعه اپلیکیشن برای دستگاه‌های پوشیدنی در اختیار توسعه‌دهندگان قرار می‌دهد. یکی از مهم‌ترین خبرها، ادغام رسمی هوش مصنوعی Gemini در Wear OS بود. البته، درخواست‌ها و پردازش‌های مرتبط با Gemini در فضای ابری انجام خواهند شد، به این معنی که ساعت‌های هوشمند برای بهره‌مندی از این قابلیت‌ها به اتصال اینترنت (از طریق تلفن همراه متصل، Wi-Fi یا شبکه LTE خود ساعت) نیاز خواهند داشت. این پیشرفت‌ها نشان‌دهنده عزم گوگل برای تبدیل Wear OS به پلتفرمی جذاب‌تر، قدرتمندتر و رقابتی‌تر در بازار رو به رشد دستگاه‌های پوشیدنی هوشمند است.

اندروید ۱۶: نگاهی گذرا به آینده اندروید با رابط کاربری دسکتاپ و یکپارچگی عمیق‌تر با هوش مصنوعی اگرچه جزئیات کامل اندروید ۱۶ بیشتر در رویداد Android Show هفته قبل از I/O معرفی شده بود، اما در کنفرانس اصلی نیز به برخی از ویژگی‌های کلیدی آن اشاره شد. یکی از مهم‌ترین این ویژگی‌ها، معرفی یک رابط کاربری دسکتاپ (Desktop UI) است که گوگل آن را با الهام و بر پایه تجربیات موفق Samsung DeX توسعه داده است. اندروید ۱۶ بر سه ستون اصلی استوار خواهد بود: بازنگری قابل توجه و گسترده در رابط کاربری با پیاده‌سازی کامل Material 3 Expressive، پشتیبانی عمیق‌تر و گسترده‌تر از هوش مصنوعی Gemini در دستگاه‌های بیشتر و در سطوح مختلف سیستم‌عامل، و ارائه ابزارها و قابلیت‌های پیشرفته‌تر برای افزایش ایمنی و حفظ حریم خصوصی کاربران.

ابزارها، پلتفرم‌ها و APIهای جدید و قدرتمند برای توانمندسازی جامعه جهانی توسعه‌دهندگان

گوگل در I/O 2025 مجموعه گسترده و متنوعی از ابزارها، SDKها و APIهای جدید و به‌روز شده را با تمرکز ویژه بر هوش مصنوعی برای جامعه جهانی توسعه‌دهندگان معرفی کرد تا آن‌ها را در ساخت نسل بعدی اپلیکیشن‌ها و تجارب هوشمند، بیش از پیش توانمند سازد.

به‌ روزرسانی‌ های کلیدی و استراتژیک برای Gemini API و SDK: قدرت بیشتر، انعطاف‌ پذیری بالاتر

نسخه به‌روز شده و بهبودیافته Gemini 2.5 Flash Preview با عملکرد بسیار قوی‌تر در وظایف مرتبط با کدنویسی و استدلال‌های پیچیده، و همچنین بهینه‌سازی شده برای سرعت و کارایی بالاتر، معرفی شد.

ابزارهای جدیدی مانند URL Context به Gemini API اضافه شد که به مدل امکان می‌دهد محتوای کامل و زمینه صفحات وب را تنها با دریافت یک لینک، درک و پردازش کند.

Gemini API و SDK اکنون از پروتکل زمینه مدل (Model Context Protocol - MCP) پشتیبانی می‌کنند که استفاده از طیف وسیعی از ابزارها و سرویس‌های متن‌باز را برای توسعه‌دهندگان به طور قابل توجهی آسان‌تر و یکپارچه‌تر می‌کند.

قابلیت فراخوانی ناهمزمان توابع (Asynchronous Function Calling) به توسعه‌دهندگان اجازه می‌دهد توابع یا ابزارهای طولانی‌مدت و زمان‌بر را در پس‌زمینه فراخوانی کنند، بدون اینکه جریان اصلی مکالمه یا عملکرد اپلیکیشن مسدود شود.

Computer Use API (که در حال حاضر در مرحله آزمایش با معتمدین و شرکای منتخب قرار دارد) به توسعه‌دهندگان امکان ساخت اپلیکیشن‌هایی را می‌دهد که می‌توانند تحت هدایت و با اجازه کاربر، وب را مرور کرده، با سایر ابزارهای نرم‌افزاری تعامل داشته و وظایف پیچیده‌ای را به صورت خودکار انجام دهند. این مجموعه به‌روزرسانی‌ها نشان می‌دهند که گوگل به طور جدی به دنبال تسهیل ساخت "عامل‌های هوشمند" (AI agents) و اپلیکیشن‌های عامل‌محور توسط توسعه‌دهندگان است.

ML Kit GenAI APIs با قدرت Gemini Nano: هوش مصنوعی چندوجهی و کارآمد بر روی خود دستگاه APIهای جدید ML Kit GenAI با استفاده از مدل سبک و کارآمد Gemini Nano برای انجام وظایف رایج هوش مصنوعی به صورت روی دستگاه (on-device)، بدون نیاز به اتصال دائمی به اینترنت، معرفی شدند. این وظایف شامل خلاصه‌سازی هوشمند متون، تصحیح گرامر و نگارش، و سایر قابلیت‌های پردازش زبان طبیعی است. Gemini Nano با ارائه حریم خصوصی بیشتر (چون داده‌ها از دستگاه خارج نمی‌شوند)، تأخیر بسیار کمتر در پاسخگویی و هزینه پایین‌تر، قابلیت‌های چندوجهی و هوشمند را مستقیماً به دستگاه‌های کاربران، به ویژه گوشی‌های هوشمند اندرویدی، می‌آورد.

Firebase AI Logic: ادغام ساده و یکپارچه مدل‌های هوش مصنوعی مولد گوگل در اپلیکیشن‌های شما سرویس Firebase AI Logic به توسعه‌دهندگان پلتفرم Firebase امکان می‌دهد تا به طور ساده و یکپارچه، مدل‌های هوش مصنوعی مولد قدرتمند گوگل، از جمله مدل‌های خانواده Gemini Pro و مدل تصویرساز Imagen را مستقیماً در اپلیکیشن‌های موبایل و وب خود ادغام کرده و از قابلیت‌های آن‌ها بهره ببرند. این امر فرآیند توسعه اپلیکیشن‌های هوشمند را برای جامعه بزرگ توسعه‌دهندگان Firebase به طور قابل توجهی تسریع بخشیده و موانع ورود به دنیای هوش مصنوعی را برای آن‌ها کاهش می‌دهد.

AI Edge Portal: مرکزی برای آزمایش و بنچمارک مدل‌های هوش مصنوعی روی دستگاه شما AI Edge Portal به عنوان یک منبع و پلتفرم جدید برای توسعه‌دهندگان معرفی شد که به آن‌ها امکان می‌دهد مدل‌های هوش مصنوعی طراحی‌شده برای اجرا روی دستگاه (on-device) خود را به راحتی آزمایش کرده، عملکرد آن‌ها را بنچمارک نموده و برای پلتفرم‌های مختلف بهینه‌سازی کنند.

گسترش خانواده مدل‌ های تخصصی و متن‌ باز Gemma: از پزشکی تا زبان اشاره و حتی ارتباط با دلفین‌ها! خانواده مدل‌های زبان بزرگ متن‌باز (Open-Source) و سبک Gemma گوگل با معرفی چندین مدل تخصصی و بسیار جالب گسترش یافت:

MedGemma: به عنوان تواناترین مدل باز گوگل برای درک متن و تصویر در حوزه پزشکی معرفی شد و برای کمک به توسعه اپلیکیشن‌های نوآورانه در زمینه سلامت و بهداشت طراحی شده است.

SignGemma: یک مدل باز آینده‌نگرانه برای ترجمه زبان‌های اشاره (در حال حاضر با بهترین عملکرد در ترجمه زبان اشاره آمریکایی به انگلیسی) به متن گفتاری است که هدف آن ایجاد اپلیکیشن‌ها و یکپارچه‌سازی‌های جدید برای توانمندسازی کاربران ناشنوا و کم‌شنوا می‌باشد.

DolphinGemma: شاید یکی از شگفت‌انگیزترین معرفی‌ها، DolphinGemma بود؛ اولین مدل زبان بزرگ جهان که برای درک و تحلیل الگوهای ارتباطی دلفین‌ها طراحی شده است! این مدل با همکاری محققان Georgia Tech و پروژه Wild Dolphin بر روی داده‌های جمع‌آوری شده از چندین دهه تحقیق میدانی آموزش دیده است. توسعه این مدل‌های Gemma تخصصی، نشان‌دهنده تعهد گوگل به استفاده از هوش مصنوعی برای حل مشکلات خاص در حوزه‌های مهم اجتماعی، علمی و حتی زیست‌محیطی، و همچنین توانمندسازی جوامع خاص و پیشبرد مرزهای دانش با استفاده از مدل‌های متن‌باز است.

سایر ابزارها و به‌روزرسانی‌های کلیدی برای توانمندسازی هرچه بیشتر توسعه‌ دهندگان:

Stitch: ابزاری نوآورانه و انقلابی برای طراحی بصری رابط کاربری (UI) که با استفاده از پیشنهادات طراحی هوشمند و مبتنی بر AI، نویدبخش تحولی شگرف در نحوه ایجاد رابط‌های کاربری زیبا و کارآمد توسط توسعه‌دهندگان است.

تجربه Colab عامل‌محورتر: گوگل وعده یک تجربه Colab کاملاً جدید و عامل‌محور (Agent-centric) را داد که می‌تواند وظایف را از طریق درک و اجرای دستورات زبان طبیعی، به طور هوشمندانه انجام دهد.

Jules Coding Assistant: دستیار کدنویسی مستقل و قدرتمند گوگل، Jules، اکنون در نسخه بتای عمومی قرار گرفته و در دسترس توسعه‌دهندگان بیشتری است.

Gemini Code Assist: نسخه‌های Standard برای افراد و همچنین نسخه مخصوص GitHub اکنون به طور عمومی در دسترس هستند و از قدرت مدل پیشرفته Gemini 2.5 برای کمک به کدنویسی بهره می‌برند.

پیشرفت‌های Baseline در ابزارهای توسعه: وضعیت Baseline اکنون در ابزارهایی مانند VS Code نمایش داده می‌شود و با داده‌های کاربران واقعی ترکیب می‌گردد تا به توسعه‌دهندگان در انتخاب هدف بهینه Baseline برای مخاطبان و اپلیکیشن‌هایشان کمک کند.

LiteRT: برای دستیابی به حداکثر کارایی و ساده‌سازی در پیاده‌سازی هوش مصنوعی در لبه (AI Edge) و دستگاه‌های موبایل معرفی شد.

سایر معرفی‌های قابل توجه و نوآوری‌های فراتر از نرم‌افزار در Google I/O 2025

علاوه بر به‌روزرسانی‌های نرم‌افزاری و مدل‌های هوش مصنوعی، گوگل از چند پروژه سخت‌افزاری و ابتکار عمل مهم دیگر نیز رونمایی کرد:

Google Beam (پروژه Starline سابق): تماس‌های ویدیویی سه‌بعدی و واقع‌گرایانه با قدرت هوش مصنوعی و ترجمه همزمان Google Beam (که پیشتر با نام رمز Project Starline شناخته می‌شد) به عنوان یک پلتفرم ارتباطات ویدیویی پیشرفته و مبتنی بر هوش مصنوعی (AI-first) معرفی شد. این سیستم شگفت‌انگیز از یک مدل ویدیویی پیشرفته برای تبدیل جریان‌های ویدیویی دوبعدی استاندارد به یک تجربه سه‌بعدی کاملاً واقع‌گرایانه و سه‌بعدی (بدون نیاز به عینک خاص) با استفاده از مجموعه‌ای از شش دوربین و یک نمایشگر میدان نوری سه‌بعدی (3D Light-field Display) بهره می‌برد. این سیستم، ردیابی سر تقریباً بی‌نقص و بسیار دقیقی را با دقت میلی‌متری و با سرعت ۶۰ فریم در ثانیه ارائه می‌دهد که منجر به ایجاد حس حضور واقعی و ارتباط چهره به چهره بسیار طبیعی می‌شود.

یکی از قابلیت‌های بسیار هیجان‌انگیز در حال توسعه برای Beam، ترجمه همزمان گفتار (Real-time Speech Translation) است که به کاربران امکان می‌دهد حتی اگر به زبان‌های مختلفی صحبت می‌کنند، مکالمه‌ای روان، طبیعی و بدون مانع زبانی داشته باشند. این قابلیت در Google Meet نیز با پشتیبانی اولیه از زبان‌های انگلیسی و اسپانیایی برای مشترکین طرح‌های AI Pro و Ultra در نسخه بتا عرضه می‌شود. برای بهره‌مندی از قابلیت تبدیل ویدیوی دوبعدی به مدل سه‌بعدی، سخت‌افزار اختصاصی مانند نمایشگری از شرکت HP با شش دوربین یکپارچه مورد نیاز است. اولین دستگاه‌های تجاری Google Beam اواخر سال ۲۰۲۵ در دسترس قرار خواهند گرفت. Google Beam نشان‌دهنده گام بلند بعدی گوگل در تکامل ارتباطات ویدیویی و تلاش برای ایجاد تعاملاتی بسیار غنی‌تر، فراگیرتر و انسانی‌تر است.

SynthID Detector: ابزاری جدید و حیاتی برای تشخیص محتوای تولید شده توسط هوش مصنوعی و مقابله با اطلاعات نادرست گوگل در پاسخ به نگرانی‌های فزاینده در مورد انتشار اطلاعات نادرست، اخبار جعلی و دیپ‌فیک‌های (Deepfakes) تولید شده توسط هوش مصنوعی، از SynthID Detector رونمایی کرد. این یک پورتال وب جدید و در دسترس عموم است که برای شناسایی اینکه آیا محتوای صوتی، تصویری، متنی یا ویدیویی توسط ابزارهای هوش مصنوعی خود گوگل تولید شده است یا خیر، طراحی شده است. SynthID با جاسازی یک واترمارک دیجیتال نامرئی و مقاوم در محتوای تولید شده توسط AI گوگل عمل می‌کند. این ابزار می‌تواند به افزایش شفافیت، پاسخگویی و اعتماد در فضای آنلاین کمک شایانی کند، هرچند اثربخشی نهایی آن به میزان پذیرش گسترده، توانایی آن در تشخیص محتوای تولید شده توسط سایر ابزارهای AI و همچنین روش‌های احتمالی برای دور زدن آن بستگی خواهد داشت.

به‌روزرسانی‌های مهم و کلیدی در حوزه امنیت و حفظ حریم خصوصی کاربران در عصر هوش مصنوعی گوگل بر تعهد خود به امنیت و حریم خصوصی کاربران تاکید کرد و از چند به‌روزرسانی مهم در این زمینه خبر داد:

مدیر رمز عبور مرورگر کروم (Chrome's Password Manager) اکنون به طور خودکار و هوشمندانه، رمزهای عبوری را که تشخیص داده شده در نشت‌های اطلاعاتی به خطر افتاده‌اند، برای کاربر تغییر می‌دهد.

مدل‌های خانواده Gemini 2.5 با پادمان‌ها و لایه‌های امنیتی پیشرفته‌تری عرضه شده‌اند که نرخ محافظت در برابر حملات تزریق پرامپت غیرمستقیم (Indirect Prompt Injection Attacks) را به طور قابل توجهی افزایش داده و آن‌ها را به امن‌ترین خانواده مدل‌های Gemini تاکنون تبدیل کرده است. این به‌روزرسانی‌ها نشان‌دهنده اهمیت فزاینده امنیت سایبری و حفاظت از داده‌های حساس کاربران در عصر هوش مصنوعی است که در آن، تهدیدات نیز به طور مداوم در حال پیچیده‌تر شدن هستند.

گسترش همکاری‌های استراتژیک گوگل در حوزه خودروهای هوشمند و عینک‌های پیشرفته واقعیت توسعه‌یافته گوگل به گسترش نفوذ هوش مصنوعی و پلتفرم‌های خود به حوزه‌های جدید ادامه می‌دهد:

شرکت خودروسازی ولوو (Volvo) قراردادی را برای قرار دادن و ادغام عمیق هوش مصنوعی Gemini در نسل بعدی خودروهای خود با گوگل امضا کرده است.

همانطور که پیشتر در بخش Android XR ذکر شد، گوگل همکاری خود را با برندهای مطرح و مدگرای عینک‌سازی مانند Gentle Monster و Warby Parker برای ایجاد عینک‌های هوشمند و شیک مبتنی بر Android XR آغاز کرده و شرکت Kering Eyewear (مالک برندهایی چون گوچی و سن لوران) نیز در آینده نزدیک به این جمع خواهد پیوست. این همکاری‌ها نشان می‌دهد که گوگل به دنبال ایجاد یک اکوسیستم هوش مصنوعی فراگیر و یکپارچه است که تمامی جنبه‌های زندگی کاربر، از گوشی هوشمند و کامپیوتر شخصی گرفته تا خودرو و دستگاه‌های پوشیدنی را در بر می‌گیرد.

جمع‌بندی نهایی و نگاهی به آینده درخشان و پر از چالش پیش روی گوگل در عصر طلایی هوش مصنوعی

کنفرانس Google I/O 2025 به وضوح و با قدرتی تمام نشان داد که هوش مصنوعی دیگر یک مفهوم آینده‌نگرانه یا یک پروژه جانبی برای گوگل نیست، بلکه به هسته اصلی، استراتژی بنیادین و نیروی محرکه تمامی فعالیت‌ها و نوآوری‌های این غول فناوری تبدیل شده است. گوگل با معرفی مجموعه‌ای از پیشرفت‌های خیره‌کننده و گسترده در مدل‌های خانواده Gemini، ابزارهای نوین برای توسعه‌دهندگان، قابلیت‌های انقلابی در جستجوی هوشمند، تولید محتوای چندرسانه‌ای خلاقانه و پلتفرم اندروید و اکوسیستم آن، چشم‌انداز بلندپروازانه خود را برای آینده‌ای که در آن هوش مصنوعی نقشی محوری، یکپارچه و همه‌جانبه در زندگی ما ایفا می‌کند، با جسارت تمام ترسیم کرد. شعار "از پژوهش به واقعیت" و تمرکز ویژه بر "دستیارهای هوشمند" و "عامل‌های AI" نشان‌دهنده بلوغ این فناوری و آمادگی کامل گوگل برای ارائه راه‌حل‌های عملی، کاربردی و ارزش‌آفرین به میلیاردها کاربر و میلیون‌ها توسعه‌دهنده در سراسر جهان است. معرفی اشتراک‌های جدید Google AI Pro و به ویژه Google AI Ultra، گامی مهم در جهت تجاری‌سازی و ارائه ارزش متمایز به کاربران حرفه‌ای و سازمانی است.

با این حال، همانطور که این فناوری‌های نوین قدرتمندتر، پیچیده‌تر و فراگیرتر می‌شوند، سوالات بسیار مهمی نیز در مورد پیامدهای اخلاقی، حفظ حریم خصوصی، امنیت داده‌ها، تأثیرات اجتماعی و اقتصادی (مانند جابجایی مشاغل)، و لزوم ایجاد چارچوب‌های نظارتی مسئولانه مطرح می‌گردد. چالش‌هایی مانند تشخیص دقیق و قابل اعتماد محتوای تولید شده توسط AI، جلوگیری از سوءاستفاده از ابزارهای قدرتمند تولید محتوا برای انتشار اطلاعات نادرست یا دیپ‌فیک‌های مخرب، و مدیریت مسئولانه داده‌های شخصی و حساس کاربران در عصر دستیارهای هوشمند همه‌چیزدان، مسائلی هستند که نه تنها گوگل، بلکه کل صنعت فناوری و جامعه جهانی باید به طور جدی به آن‌ها پرداخته و راه‌حل‌های پایداری برایشان بیابند.

در نهایت، Google I/O 2025 نه تنها مجموعه‌ای از محصولات، سرویس‌ها و ویژگی‌های جدید و هیجان‌انگیز را به نمایش گذاشت، بلکه بیش از هر چیز، جهت‌گیری استراتژیک، قدرت فنی و جاه‌طلبی بی‌حد و مرز گوگل را در رقابت فزاینده و نفس‌گیر هوش مصنوعی به تصویر کشید. موفقیت این شرکت در تحقق وعده‌های بلندپروازانه خود و همچنین مدیریت هوشمندانه و مسئولانه چالش‌های عظیم پیش رو، بدون شک آینده تعامل ما با فناوری و حتی مسیر تکامل جامعه بشری را در دهه‌های آینده شکل خواهد داد. بذرهای انقلاب هوش مصنوعی توسط گوگل و سایر پیشگامان این عرصه کاشته شده‌اند؛ اکنون زمان آن است که با دقت، آینده‌نگری و مسئولیت‌پذیری جمعی، از رشد و شکوفایی آن‌ها مراقبت کنیم تا به جای گرفتار شدن در جنگلی از پیچیدگی‌ها و خطرات تکنولوژیک، از باغی پرثمر، سرشار از فرصت و پیشرفت برای همگان بهره‌مند شویم. های‌ورت (hiwert.com) با افتخار این مسیر پر از شگفتی را همراه با شما دنبال خواهد کرد.

کلمات کلیدی: Google I/O 2025، خلاصه رویداد گوگل، هوش مصنوعی گوگل، Gemini 2.5 Pro، Deep Think، Google AI Ultra، Google AI Pro، Veo 3، تولید ویدیو با صدا، ابزار فیلمسازی Flow، Imagen 4، تولید تصویر با AI، Project Astra، Project Mariner، Android XR، Material 3 Expressive، Wear OS 6، های ورت، اخبار تکنولوژی، سوندار پیچای.

مطالب مرتبط

معرفی میسترال Devstral: هوش مصنوعی جدید و تخصصی برای کدنویسی که توسط استارتاپ پیشرو اروپایی عرضه شده است.

معرفی میسترال Devstral: هوش مصنوعی کدنویسی متن‌ باز برای توسعه‌ دهندگان

محصول جدید و مرموز OpenAI؛ یک دستگاه هوشمند بدون صفحه نمایش با قابلیت آگاهی محیطی که توسط خالق ChatGPT عرضه میشود.

محصول جدید OpenAI: خالق ChatGPT با یک سورپرایز بزرگ در راه است!

اولین شاسی‌ بلند برقی شیائومی، YU7، با طراحی لوکس و رنگ سبز زمردی؛ رقیب جدی تسلا در بازار خودرو های برقی.

شیائومی از اولین شاسی بلند برقی خود رونمایی کرد، آیا تسلا را به چالش میکشد؟!

آموزش استفاده از قابلیت "Try it on" گوگل برای پرو مجازی لباس؛ تجربه خرید آنلاین هوشمندتر با هوش مصنوعی.

پرو مجازی لباس با هوش مصنوعی گوگل: خرید آنلاین هوشمند با عکس شما