گزارش کامل Google I/O 2025: رونمایی های هوش مصنوعی Gemini، Veo و Flow
پوشش جامع و تحلیلی رویداد Google I/O 2025 از های ورت (hiwert.com). با جدیدترین رونمایی های گوگل در هوش مصنوعی شامل Gemini 2.5، Veo 3، Flow، Imagen 4 و اشتراک AI Ultra آشنا شوید.

بازتعریف آینده با هوش مصنوعی: نگاهی جامع به شگفت انگیزترین رونمایی های Google I/O 2025 از قلب های ورت
Google I/O 2025، ویترین جاه طلبی های گوگل در عصر هوش مصنوعی اول (AI-First)
کنفرانس سالانه توسعهدهندگان گوگل، Google I/O، همواره یکی از مهم ترین رویدادهای دنیای فناوری بوده است؛ رویدادی که نه تنها جدیدترین دستاوردها و محصولات این غول فناوری را به نمایش میگذارد، بلکه چشمانداز و مسیر آینده آن را نیز برای توسعهدهندگان، کسبوکارها و عموم کاربران ترسیم میکند. رویداد Google I/O 2025 که در تاریخ ۲۰ و ۲۱ می ۲۰۲۵ (معادل ۳۰ و ۳۱ اردیبهشت ۱۴۰۴) به صورت حضوری در آمفیتئاتر شواِلاین و همچنین به طور مجازی برای مخاطبان جهانی برگزار شد، بیش از هر زمان دیگری، صحنه نمایش تعهد عمیق و همهجانبه گوگل به هوش مصنوعی (AI) و تلاش بیوقفه این شرکت برای ادغام یکپارچه و هوشمندانه آن در سراسر اکوسیستم گسترده محصولات و سرویسهایش بود. در این مقاله جامع از هایورت (hiwert.com)، قصد داریم به قلب تپنده این رویداد هیجانانگیز سفر کنیم و مهمترین رونماییها، بهروزرسانیها و چشماندازهای ارائه شده توسط گوگل را با نگاهی تحلیلی و دقیق مورد بررسی قرار دهیم.
مروری بر اهداف، چشماندازها و شعار محوری Google I/O 2025: "از پژوهش به واقعیت" Google I/O 2025 با تمرکزی بیسابقه بر توانمندسازی جامعه جهانی توسعهدهندگان از طریق ارائه ابزارها، پلتفرمها و مدلهای نوین هوش مصنوعی برگزار شد. شعار محوری "از پژوهش به واقعیت" (From Research to Reality) به وضوح در بطن تمامی معرفیها و نمایشهای این کنفرانس منعکس بود. هدف اصلی گوگل، تبدیل دستاوردهای تحقیقاتی پیشرفته و گاه پیچیده در حوزه هوش مصنوعی به محصولاتی کاربردی، قابل دسترس و ارزشآفرین برای عموم کاربران و کسبوکارهای مختلف در سراسر جهان است. این رویداد نه تنها نمایانگر پیشرفتهای فناورانه خیرهکننده گوگل بود، بلکه نشاندهنده یک تغییر پارادایم عمیقتر و استراتژیک در هویت این غول فناوری به سمت یک شرکت کاملاً "AI-first" (هوش مصنوعی در اولویت) است.
در این پارادایم جدید، هوش مصنوعی دیگر تنها یک ویژگی یا قابلیت جانبی در محصولات گوگل نیست، بلکه به هسته اصلی و نیروی محرکه تمامی نوآوریها و محصولات آینده این شرکت تبدیل شده است. تأکید مکرر بر انتقال سریع و کارآمد از مدلهای تحقیقاتی به کاربردهای عملی و در دسترس برای میلیاردها کاربر، گواهی بر این مدعاست. گوگل با این رویکرد بلندپروازانه، به دنبال آن است که جستجو، که زمانی محصول اصلی و تعریفکننده آن بود، تنها به یکی از نمودهای متعدد و قدرتمند توانمندیهای هوش مصنوعی این شرکت تبدیل شود.
H3: هوش مصنوعی مولد و عصر دستیارهای هوشمند فوق پیشرفته: تم اصلی و نیروی محرکه کنفرانس هوش مصنوعی مولد (Generative AI) و ظهور نسل جدیدی از دستیارهای هوشمند (AI agents) فوق پیشرفته، به عنوان تم اصلی و نیروی محرکه بلامنازع کنفرانس Google I/O 2025 خودنمایی میکردند. گوگل به طور گسترده و با ارائه دموهای متعدد و هیجانانگیز، نشان داد که چگونه هوش مصنوعی میتواند به شکلی فعال، پیشدستانه و بسیار کارآمدتر از گذشته، در انجام وظایف مختلف، از کارهای روزمره گرفته تا پروژههای پیچیده خلاقانه و تحقیقاتی، به کاربران یاری رساند. سوندار پیچای، مدیرعامل گوگل، در سخنرانی افتتاحیه خود با تاکید بر اینکه دههها پژوهش و سرمایهگذاری گوگل در زمینه هوش مصنوعی اکنون در حال تبدیل شدن به واقعیتهای ملموس و تأثیرگذار برای مردم در سراسر جهان است، این چشمانداز را تقویت کرد. تأکید بر "دستیارهای هوشمند" در I/O 2025، فراتر از صرفاً بهبود پاسخگویی به دستورات صوتی یا متنی ساده کاربران بود.
گوگل در حال توسعه سیستمهایی است که قادرند اهداف پیچیده و چندمرحلهای کاربران را درک کرده، برای رسیدن به آنها برنامهریزی کنند و در چندین مرحله و از طریق تعامل با برنامههای کاربردی مختلف، اقدامات لازم را به طور هوشمندانه به انجام رسانند. این رویکرد، گامی بلند به سوی تحقق هوش مصنوعی واقعاً یاریرسان، زمینهآگاه و تا حدی مستقل محسوب میشود. معرفی پروژههایی مانند Project Mariner به عنوان یک عامل پژوهشی با قابلیت انجام وظایف متعدد در وب، قابلیتهای Agent Mode در اپلیکیشن Gemini برای انجام اموری چون رزرو سفر یا جستجوی آپارتمان، و ادغام قابلیتهای عاملیتی در جستجوی گوگل (AI Mode) برای کمک به فرآیندهای پیچیدهای مانند خرید آنلاین و برنامهریزی سفر، همگی نشاندهنده این جهتگیری استراتژیک و آیندهنگرانه هستند.
گوگل دیگر تنها به دنبال ارائه سریع اطلاعات نیست، بلکه میخواهد به طور فعال و هوشمندانه به کاربران در به سرانجام رساندن وظایف و دستیابی به اهدافشان کمک کند. رشد تصاعدی و خیرهکننده پردازش توکنها توسط مدلهای گوگل، از ۹.۷ تریلیون توکن در ماه به ۴۸۰ تریلیون توکن در ماه، و همچنین افزایش پنج برابری تعداد توسعهدهندگان فعال بر روی پلتفرم Gemini تنها از سال گذشته، نشاندهنده سرعت بالای پذیرش، مقیاسپذیری چشمگیر و قدرت روزافزون زیرساخت هوش مصنوعی گوگل است. این ارقام نه تنها بیانگر توان فنی بیبدیل گوگل در مدیریت این حجم عظیم از پردازش و داده هستند، بلکه زمینه را برای نوآوریهای سریعتر، پیچیدهتر و تأثیرگذارتر در آینده نزدیک فراهم میکنند. این توانایی در مدیریت مقیاس، یک مزیت رقابتی کلیدی و استراتژیک برای گوگل در رقابت نفسگیر هوش مصنوعی به شمار میرود و نشان میدهد که این شرکت برای پشتیبانی از موج بعدی برنامههای کاربردی و سرویسهای مبتنی بر هوش مصنوعی کاملاً آماده و مجهز است.
اکوسیستم قدرتمند Gemini: پیشران اصلی نوآوریهای هوش مصنوعی گوگل در I/O 2025
خانواده مدلهای هوش مصنوعی Gemini، به عنوان قلب تپنده استراتژی AI-first گوگل، در مرکز بسیاری از رونماییهای Google I/O 2025 قرار داشتند. این شرکت از بهروزرسانیهای قابل توجهی برای این مدلها و همچنین قابلیتهای جدیدی برای توسعهدهندگان و کاربران نهایی پردهبرداری کرد.
بهروزرسانی های کلیدی و چشمگیر برای خانواده مدلهای پیشرفته Gemini (شامل Gemini 2.5 Pro و Flash) در Google I/O 2025، گوگل از بهروزرسانی های قابل توجهی برای مدلهای پرچمدار خود، به ویژه Gemini 2.5 Pro و Gemini 2.5 Flash، رونمایی کرد. این بهروزرسانیها بر بهبود عملکرد در زمینههایی چون کدنویسی پیشرفته، استدلال پیچیده و چندمرحلهای، و همچنین بهینهسازی برای سرعت، کارایی و کاهش هزینهها متمرکز بودند. گوگل تاکید کرد که این مدلها اکنون قادرند وظایف پیچیدهتری را با دقت و سرعت بیشتری انجام دهند و به توسعهدهندگان امکان میدهند تا اپلیکیشنهای هوشمند قدرتمندتری بسازند.
قابلیتهای پیشرفته و منحصربهفرد استدلال با حالت "Deep Think" در Gemini 2.5 Pro: یکی از برجستهترین و شاید بتوان گفت، انقلابیترین معرفیها در این بخش، حالت استدلال پیشرفته "Deep Think" برای مدل Gemini 2.5 Pro بود. این حالت که از جدیدترین تکنیکها و دستاوردهای پژوهشی گوگل در زمینه تفکر، برنامهریزی و استدلال عمیق بهره میبرد، به مدل امکان میدهد تا پیش از ارائه پاسخ نهایی، چندین فرضیه و مسیر راهحل ممکن را مورد بررسی و ارزیابی قرار دهد. Deep Think به طور خاص برای موارد استفاده بسیار پیچیده مانند حل مسائل ریاضی سطح بالا، کدنویسی پیشرفته و وظایف نیازمند استدلال چندمرحلهای طراحی شده است و توانسته در بنچمارکهای دشوار و معتبری نظیر UAMO امتیازات قابل توجه و رکوردشکنی کسب کند. معرفی Deep Think نشانگر حرکت بلندپروازانه گوگل به سمت توسعه مدلهایی با قابلیت "تفکر" عمیقتر و فرآیندهای شناختی شبیهتر به انسان است؛ فراتر از صرفاً تطبیق الگو یا بازیابی اطلاعات، و به سمت تولید دانش، خلاقیت و ارائه راهحلهای نوآورانه برای مسائل بسیار پیچیده.
خروجی صوتی بومی (Native Audio Output) و قابلیتهای چندوجهی گسترشیافته: مدلهای Gemini 2.5 Pro و Flash اکنون از قابلیت "خروجی صوتی بومی" از طریق Live API پشتیبانی میکنند. این ویژگی پیشرفته امکان تولید گفتاری بسیار طبیعی، روان و انسانی را با قابلیت کنترل دقیق و دانهای بر لحن، لهجه، سبک بیان و حتی احساسات صدا فراهم میآورد. نکته قابل توجه دیگر، پشتیبانی این مدلها برای اولین بار از چند گوینده (تا دو صدای مجزا و قابل تفکیک) و همچنین قابلیت تغییر زبان یکپارچه (Seamless Language Switching) در بیش از ۲۴ زبان مختلف در حین مکالمه یا تولید محتوای صوتی است. این قابلیتهای صوتی پیشرفته، مرزهای جدیدی را برای توسعه اپلیکیشنهای محاورهای، دستیارهای صوتی هوشمند، ابزارهای یادگیری زبان، تولید محتوای چندرسانهای جهانی و تجربههای کاربری فراگیر باز میکند.
بودجه های تفکر (Thinking Budgets) و خلاصه های تفکر (Thought Summaries) برای توسعه دهندگان: برای جامعه توسعهدهندگان، گوگل قابلیت نوآورانه "Thinking Budgets" را برای مدلهای Gemini 2.5 Pro و Flash معرفی کرد. این ویژگی به توسعهدهندگان این امکان را میدهد تا با ایجاد یک تعادل هوشمندانه بین میزان تأخیر (Latency) و کیفیت خروجی نهایی، هزینههای استفاده از مدل را به طور موثرتری کنترل و بهینه کنند. علاوه بر این، قابلیت "Thought Summaries" فرآیند فکری، مراحل استدلال و زنجیره تصمیمگیری مدل را به شکلی واضح، ساختاریافته و قابل فهم نمایش میدهد. این شفافیت، فرآیند اعتبارسنجی پاسخها و اشکالزدایی (Debugging) وظایف پیچیده هوش مصنوعی را برای توسعهدهندگان به طور قابل توجهی تسهیل و تسریع میبخشد. این ویژگیها نشاندهنده بلوغ روزافزون پلتفرم Gemini و تمرکز گوگل بر ارائه ابزارهای عملی، کارآمد و قابل کنترل برای توسعهدهندگان، به ویژه در سطح سازمانی و برای کاربردهای تجاری است.
معرفی و بازنگری در اشتراک های جدید و پرمیوم Google AI: طرحهای Pro و Ultra برای کاربران حرفهای گوگل ساختار اشتراک سرویسهای هوش مصنوعی خود را با معرفی دو سطح پولی جدید و قدرتمند بازنگری و گسترش داد: Google AI Pro که جایگزین طرح AI Premium سابق شده و با قیمت ماهانه ۱۹.۹۹ دلار عرضه میشود، و طرح فوق پیشرفته Google AI Ultra که با قیمت ماهانه ۲۴۹.۹۹ دلار (پس از اعمال تخفیف ۵۰ درصدی برای سه ماه اول در ایالات متحده برای کاربران جدید) برای کاربران بسیار حرفهای و سازمانهایی که به بالاترین سطح از توانمندیهای AI گوگل نیاز دارند، در نظر گرفته شده است. برای اطلاعات بیشتر در مورد این اشتراک جامع، میتوانید به مقاله اختصاصی هایورت با عنوان "[اشتراک Google AI Ultra گوگل: ۲۵۰ دلار برای بهترین هوش مصنوعی و امکانات پرمیوم]([ به مقاله AI Ultra در های ورت])" مراجعه کنید.
به طور خلاصه، اشتراک Google AI Pro شامل دسترسی به اپلیکیشن Gemini (همراه با مدل Gemini 2.5 Pro، قابلیت Deep Research و Veo 2)، ابزار فیلمسازی Flow، محدودیتهای بالاتر برای ابزار تبدیل تصویر به ویدیو Whisk، پلتفرم NotebookLM، ادغام Gemini در سرویسهایی نظیر Gmail، Docs و Vids، دسترسی اولیه به Gemini در مرورگر کروم و ۲ ترابایت فضای ذخیرهسازی ابری است. در مقابل، اشتراک Google AI Ultra بالاترین سطح دسترسی و بیشترین محدودیتهای استفاده را در قابلیت Deep Research، تولید ویدیو با Veo 2 و دسترسی زودهنگام به مدل پیشگامانه Veo 3 با قابلیت تولید صدای بومی ارائه میدهد. علاوه بر این، این طرح شامل ۳۰ ترابایت فضای ذخیرهسازی، ابزار فیلمسازی Flow و دسترسی به Project Mariner، نمونه اولیه یک عامل پژوهشی هوشمند، و همچنین اشتراک YouTube Premium میباشد. معرفی سطح Ultra با این قیمت و امکانات، نشاندهنده استراتژی گوگل برای هدف قرار دادن بخش حرفهای بازار و کسب درآمد از سرمایهگذاریهای عظیم خود در تحقیق و توسعه هوش مصنوعی است.
Gemini Live: دستیار صوتی هوشمندتر، تعاملیتر و اکنون رایگان برای همگان! Gemini Live، تجربه مکالمه صوتی پیشرفته با دستیار هوش مصنوعی گوگل، اکنون به صورت رایگان برای تمامی کاربران در دسترس قرار گرفته است. این قابلیت برجسته، امکان برقراری مکالمات روان، طبیعی و بسیار پویاتر با Gemini را فراهم میآورد. ویژگیهای کلیدی آن شامل امکان استفاده از دوربین گوشی هوشمند برای استخراج اطلاعات از محیط اطراف در زمان واقعی و همچنین قابلیت اشتراکگذاری صفحه نمایش با Gemini برای دریافت راهنمایی و تحلیل محتوای بصری است. مهمتر آنکه، این ویژگی اکنون به آیفونهای سازگار نیز گسترش یافته و طیف وسیعتری از کاربران را در پلتفرمهای مختلف پوشش میدهد. علاوه بر این، قابلیتهای کلیدی پروژه پیشرفته Project Astra (که در ادامه به آن خواهیم پرداخت)، نظیر استفاده هوشمندانه از دوربین و امکان اشتراکگذاری یکپارچه صفحه، اکنون در Gemini Live نیز ادغام شدهاند. رایگان شدن Gemini Live و گسترش آن به پلتفرم iOS، نشان دهنده تلاش جدی گوگل برای افزایش نفوذ دستیار هوشمند Gemini و رقابت مستقیم با سایر دستیارهای صوتی مطرح در بازار، با ارائه قابلیتهای تعاملی و چندوجهی پیشرفتهتر است.
ادغام عمیق و گسترده Gemini در محصولات کلیدی گوگل: از مرورگر کروم تا مجموعه Workspace و فراتر از آن هوش مصنوعی Gemini به طور فزایندهای در حال ادغام با تار و پود محصولات و سرویسهای مختلف گوگل است تا تجربهای هوشمندتر و یکپارچه تر را برای کاربران فراهم آورد. در مرورگر کروم دسکتاپ، این قابلیت اکنون برای مشترکین طرحهای AI Pro و Ultra در دسترس قرار گرفته و به آنها امکان میدهد تا از Gemini برای درک و توضیح اطلاعات پیچیده موجود در صفحات وب یا خلاصهسازی سریع و کارآمد محتوای آنلاین استفاده کنند. در سرویس Gmail نیز، ویژگی محبوب پاسخهای هوشمند (Smart Replies) با بهرهگیری از قدرت Gemini به طور قابل توجهی شخصی سازی شده اند.
این سیستم اکنون قادر است با تحلیل هوشمندانه صندوق ورودی و حتی محتوای Google Drive کاربر (با رعایت کامل حریم خصوصی)، پاسخهایی را پیشنهاد دهد که از نظر لحن، سبک نگارش و زمینه گفتگو، تطابق بسیار بیشتری با شیوه معمول و ترجیحات ارتباطی خود کاربر داشته باشند. مجموعه Google Workspace (شامل Docs، Sheets، Slides و Vids) نیز شاهد بهروزرسانیهای قابل توجهی با محوریت هوش مصنوعی و ادغام عمیقتر با Gemini خواهد بود که کارایی، خلاقیت و هوشمندی این ابزارهای بهرهوری را به سطح جدیدی ارتقا میبخشد. این استراتژی ادغام گسترده، که میتوان آن را "هوش مصنوعی محیطی" (Ambient AI) نامید، هوش مصنوعی را به بخشی جداییناپذیر و نامحسوس از تجربه روزمره میلیاردها کاربر تبدیل کرده و پتانسیل افزایش بهرهوری و وفاداری به اکوسیستم گوگل را به همراه دارد.
تحول بنیادین در جستجو و شیوه تعامل ما با اطلاعات: از بازیابی لینک تا دستیاری هوشمند
گوگل در I/O 2025 نشان داد که آینده جستجو، فراتر از ارائه لیستی از لینکها خواهد بود و به سمت یک تجربه محاورهای، تحلیلی و اقداممحور حرکت میکند.
-
معرفی رسمی AI Mode در جستجوی گوگل: تجربه ای محاوره ای، عمیق و پاسخ هایی جامع تر از همیشه گوگل از قابلیت جدید و هیجانانگیزی تحت عنوان "AI Mode" در موتور جستجوی خود رونمایی کرد که هدف آن ارائه تجربه جستجویی بسیار پویاتر، محاورهایتر و ارائه پاسخهایی جامع و چندوجهی به کاربران است. این حالت جدید قادر است سوالات پیچیده، چندبخشی و حتی سوالات تکمیلی و پیگیریکننده کاربران را به خوبی مدیریت کند. AI Mode برای یافتن پاسخها به منابع عمیقتر و متنوعتری نسبت به جستجوی سنتی رجوع کرده و بنا بر ادعای گوگل، صحت و اعتبار پاسخهای خود را نیز با دقت مورد بررسی قرار میدهد تا از ارائه اطلاعات نادرست یا "توهمات هوش مصنوعی" (AI Hallucinations) تا حد امکان جلوگیری شود. این قابلیت از هفته برگزاری کنفرانس برای تمامی کاربران در ایالات متحده آمریکا عرضه شده و مدل پیشرفته Gemini 2.5 نیز برای پشتیبانی از AI Mode و همچنین قابلیت AI Overviews در این کشور فعال گردیده است.
قابلیتهای پیشرفته و شگفتانگیز: از خلاصهسازی هوشمند تا تحلیل داده و بصریسازی اطلاعات: AI Mode تنها به ارائه پاسخهای متنی خلاصه نمیشود. این حالت جدید توانایی خلاصهسازی هوشمندانه اطلاعات از منابع متعدد، تحلیل دادههای پیچیده (به عنوان مثال، دادههای آماری ورزشی یا اطلاعات مالی و بورسی) و نمایش یافتهها و نتایج در قالب نمودارها، جداول و چارتهای تولید شده توسط هوش مصنوعی را داراست. علاوه بر این، قابلیت Deep Search نیز برای ارائه پاسخهای بسیار عمیقتر، پژوهشمحورتر و با جزئیات بیشتر، در بخش Labs جستجوی گوگل در دسترس کاربران قرار خواهد گرفت. این تحول بنیادین در جستجو، آن را از یک ابزار صرفاً برای بازیابی لینکها، به یک دستیار تحلیلی، بصری و حتی برنامهریز تبدیل میکند. گوگل با این اقدام، قصد دارد کاربران را برای مدت زمان طولانیتری در پلتفرم خود نگه دارد و نیاز آنها به مراجعه به وبسایتهای متعدد برای یافتن و ترکیب اطلاعات کامل را به طور قابل توجهی کاهش دهد. این رویکرد، بدون شک میتواند مدل کسبوکار فعلی گوگل که بخش زیادی از آن مبتنی بر کلیک روی تبلیغات در صفحات نتایج جستجو است و همچنین میزان ترافیک ارگانیک وبسایتهای دیگر را در آینده تحت تأثیر قرار دهد.
-
Search Live: جستجوی بصری، آنی و تعاملی با قدرت شگفتانگیز پروژه پیشرفته Project Astra قابلیت نوآورانه Search Live که در تابستان برای کاربران عرضه خواهد شد، به آنها اجازه میدهد تا با استفاده از دوربین گوشی هوشمند خود، به صورت زنده، در لحظه و کاملاً تعاملی با موتور جستجوی گوگل در مورد آنچه مشاهده میکنند، به گفتگو بپردازند. این ویژگی پیشگامانه از توانمندیهای پروژه فوق پیشرفته Project Astra (که در ادامه بیشتر به آن میپردازیم) بهره میبرد. Search Live مرز میان دنیای فیزیکی و دیجیتال را بیش از پیش کمرنگ ساخته و فرآیند جستجو را به تجربهای کاملاً وابسته به زمینه، محیط اطراف و تعامل بصری کاربر تبدیل میکند. این قابلیت، پتانسیل بسیار زیادی در حوزههایی نظیر آموزش تعاملی، خرید آنلاین هوشمند، راهنمای گردشگری و ترجمه زنده متون و اشیاء در محیط واقعی دارد و میتواند نحوه تعامل ما با اطلاعات مربوط به اشیاء، مکانها و محیط پیرامونمان را به کلی دگرگون سازد.
-
Project Astra: چشمانداز بلندپروازانه گوگل برای خلق یک دستیار جهانی، یکپارچه و همه فن حریف هوش مصنوعی گوگل در رویداد I/O 2025، پیشرفتهای بیشتری را در Project Astra، پروژه بسیار بلندپروازانه خود برای ساخت یک دستیار جهانی و چندوجهی هوش مصنوعی، به نمایش گذاشت. دموهای ارائهشده، قابلیتهای پیشرفته این دستیار در درک زمینههای پیچیده بصری و صوتی، به خاطر سپردن اطلاعات قبلی، و توانایی آن برای اقدام فعال و پیشدستانه در دستگاههای مختلف کاربر (از گوشی هوشمند گرفته تا عینکهای هوشمند آینده) را به تصویر کشیدند. همانطور که پیشتر اشاره شد، قابلیتهای کلیدی Project Astra، نظیر استفاده هوشمندانه از دوربین و امکان اشتراکگذاری یکپارچه صفحه، اکنون در Gemini Live نیز ادغام شدهاند. Project Astra نشاندهنده جاهطلبی گوگل برای ایجاد یک دستیار هوش مصنوعی یکپارچه، همهجانبه و واقعاً مفید است که میتواند در تمامی جنبههای زندگی دیجیتال و حتی فیزیکی کاربر حضور داشته باشد و به طور هوشمندانه به او در انجام امور مختلف، از برنامهریزی روزانه گرفته تا حل مسائل پیچیده، یاری رساند. موفقیت این پروژه میتواند تعریف جدیدی از تعامل انسان و کامپیوتر ارائه دهد و راه را برای دستیارهای هوش مصنوعی مرکزی که قادر به هماهنگسازی وظایف در سراسر اکوسیستم یک شرکت و حتی فراتر از آن هستند، هموار سازد.
-
Project Mariner: دستیار هوشمند و عامل پژوهشی گوگل برای انجام وظایف متعدد و پیچیده در محیط وب Project Mariner به عنوان یک نمونه اولیه از یک عامل پژوهشی (Research Agent) با هدف کمک به کاربران در انجام وظایف زمانبر اما نسبتاً ساده در محیط گسترده وب معرفی شد. این دستیار هوشمند و عاملمحور (Agentic) قادر است تا ۱۰ وظیفه را به طور همزمان مدیریت کند و در اموری مانند جستجوی اطلاعات از منابع متعدد، انجام رزروهای سفر و هتل، خرید آنلاین محصولات و اجرای تحقیقات اولیه به کاربران یاری رساند. دسترسی به Project Mariner در ابتدا محدود به مشترکین طرح Google AI Ultra در ایالات متحده خواهد بود، اما گوگل اعلام کرده که قابلیتهای آن در آینده به Gemini API و پلتفرم Vertex AI نیز افزوده خواهد شد تا توسعهدهندگان بتوانند عاملهای مشابهی را برای کاربردهای خاص خود ایجاد کنند. Project Mariner گام مهمی به سوی تحقق دستیارهای هوش مصنوعی است که میتوانند به طور مستقل و با حداقل نظارت کاربر، در وبگردی، جمعآوری اطلاعات و انجام تراکنشهای آنلاین به او کمک کنند. این فناوری پتانسیل دگرگونی کامل نحوه تعامل ما با خدمات آنلاین را دارد، اما در عین حال، سوالات مهمی را نیز در مورد امنیت دادهها، حفظ حریم خصوصی کاربران و نیاز به چارچوبهای نظارتی برای عملکرد این عاملهای هوشمند مطرح میکند.
-
نوآوری های شگفت انگیز در خرید آنلاین: از پرو مجازی لباس با هوش مصنوعی تا فرآیند پرداخت هوشمند و خودکار گوگل در رویداد I/O 2025، تجربه خرید آنلاین جدید و بسیار پیشرفتهای را در بستر AI Mode موتور جستجوی خود معرفی کرد که با بهرهگیری از تصاویر الهامبخش، راهنمایی هوشمند مبتنی بر سلیقه کاربر و دادههای محصول قابل اعتماد، فرآیند کشف و خرید آنلاین محصولات را متحول میسازد. یکی از برجستهترین و جذابترین ویژگیهای این تجربه جدید، قابلیت "Try On" (پرو مجازی) است که به کاربران اجازه میدهد تنها با آپلود یک عکس از خود یا انتخاب یک مدل با مشخصات بدنی مشابه، میلیاردها قلم لباس مختلف از برندهای گوناگون را به صورت مجازی بر تن خود مشاهده کنند و تناسب و ظاهر آن را ارزیابی نمایند. علاوه بر این، یک قابلیت پرداخت هوشمند و عاملمحور (Agentic Checkout) نیز برای کمک به کاربران در انجام خرید با بهترین قیمت و به سادهترین شکل ممکن معرفی شد. این سیستم شامل امکاناتی نظیر ردیابی قیمت محصولات در فروشگاههای مختلف، اعمال خودکار کدهای تخفیف موجود و تکمیل خودکار فرآیند پرداخت با استفاده از Google Pay است. این نوآوریها، خرید آنلاین را به تجربهای بسیار شخصیتر، تعاملیتر، سرگرمکنندهتر و کارآمدتر تبدیل میکنند و پتانسیل آن را دارند که نرخ تبدیل را برای فروشندگان آنلاین به طور قابل توجهی افزایش دهند. با این حال، جمعآوری و پردازش دادههای مربوط به مشخصات بدنی، سلیقه و ترجیحات خرید کاربران، نگرانیهای مربوط به حفظ حریم خصوصی و امنیت دادهها را بیش از پیش تشدید میکند و نیازمند شفافیت و کنترل کامل کاربر بر دادههای خود میباشد.
انقلاب در تولید محتوای چندرسانهای خلاقانه و حرفهای با هوش مصنوعی گوگل
گوگل در I/O 2025 نشان داد که هوش مصنوعی مولد نه تنها در درک و پردازش محتوا، بلکه در خلق محتوای چندرسانهای با کیفیت بالا نیز به پیشرفتهای چشمگیری دست یافته است.
-
Imagen 4: نسل جدید و قدرتمند تولید تصویر از متن با قابلیت بینظیر رندر دقیق متن در تصاویر گوگل از Imagen 4، نسخه جدید، بهبودیافته و بسیار قدرتمندتر مدل تولید تصویر از متن خود، رونمایی کرد. این نسخه با کیفیت تصویر ارتقاء یافته، درک بهتر از پرامپتهای پیچیده و سرعت پردازش بالاتری نسبت به نسلهای قبلی عرضه شده است. اما پیشرفت چشمگیر و کلیدی Imagen 4، توانایی منحصربهفرد آن در مدیریت صحیح کاراکترها و رندر دقیق، خوانا و طبیعی متن در داخل تصاویر تولید شده است. این مدل اکنون میتواند متن را با قالببندی صحیح و در مکانهای منطقی و معقول درون تصویر، به گونهای که با سایر عناصر بصری هماهنگ باشد، تولید کند. Imagen 4 به عنوان بخشی از ابزار فیلمسازی هوش مصنوعی Google Flow (که در ادامه به آن میپردازیم) نیز ادغام شده است. برای آشنایی بیشتر با این مدل تصویرساز شگفتانگیز، میتوانید به مقاله اختصاصی هایورت با عنوان "[معرفی گوگل Imagen 4: بهترین مدل تصویرساز AI برای مهندسی خلاقیت]([لینک به مقاله Imagen 4 در هایورت])" مراجعه کنید. این پیشرفت، Imagen 4 را برای کاربردهای عملیتر در طراحی گرافیک، تبلیغات، تولید محتوای آموزشی و بازاریابی بسیار مناسبتر از گذشته میکند.
-
Veo 3: تولید ویدیوهای فوقالعاده واقعگرایانه با قابلیت نوین و انقلابی "تولید صدای بومی" و همزمان Veo 3، جدیدترین و پیشرفتهترین مدل تولید ویدیوی گوگل، با بهبودهای قابل توجهی در کیفیت بصری، درک بهتر از قوانین فیزیک، حرکت طبیعی و پیوستگی صحنهها، و مهمتر از همه، با قابلیت نوین و انقلابی "تولید صدای بومی" (Native Audio Generation) معرفی شد. این قابلیت شگفتانگیز به معنای تولید خودکار و همزمان صداهای محیطی، افکتهای صوتی و حتی دیالوگ شخصیتها به طور مستقیم و یکپارچه در فرآیند ساخت ویدیو توسط هوش مصنوعی است؛ امری که پیش از این نیازمند مراحل جداگانه، پیچیده و پرهزینه صدابرداری و صداگذاری بود. Veo 3 نیز همانند Imagen 4، در پلتفرم فیلمسازی پیشرفته Google Flow ادغام شده و دسترسی اولیه به آن، به ویژه قابلیت تولید صدای بومی، برای مشترکین طرح Google AI Ultra فراهم گردیده است. برای کسب اطلاعات تکمیلی در مورد این مدل ویدیوساز پیشگام، مطالعه مقاله هایورت با عنوان "[هوش مصنوعی گوگل Veo 3 معرفی شد، با قابلیت افزودن صدا به ویدیو]([لینک به مقاله Veo 3 در هایورت])" را به شما پیشنهاد میکنیم. تولید همزمان ویدیو و صدای بومی یک جهش کوانتومی در ابزارهای تولید محتوای مبتنی بر هوش مصنوعی محسوب میشود و میتواند آینده فیلمسازی و تولید محتوای ویدیویی را دگرگون سازد.
-
Google Flow: رونمایی از پلتفرم فیلمسازی جامع و یکپارچه مبتنی بر هوش مصنوعی برای خالقان محتوا Google Flow به عنوان یک ابزار فیلمسازی نوین، قدرتمند و جامع مبتنی بر هوش مصنوعی معرفی شد که برای بهرهگیری از تمام توانمندیهای مدلهای پیشرفته Veo (برای ویدیو)، Imagen (برای تصویر) و Gemini (برای درک پرامپت و منطق) طراحی و توسعه یافته است. هدف اصلی Flow، کمک به داستاننویسان، فیلمسازان و تمامی خالقان محتوا برای کشف و پرورش ایدههای خلاقانه خود بدون محدودیتهای فنی و تولید کلیپها، سکانسها و صحنههای سینمایی با کیفیت برای روایت داستانهایشان است. جزئیات بیشتر در مورد این ابزار هیجانانگیز را میتوانید در مقاله اختصاصی هایورت با عنوان "[ابزار فیلمسازی Flow گوگل با هوش مصنوعی: تولید فیلم سینمایی با Veo و Imagen]([لینک به مقاله Flow در هایورت])" مطالعه فرمایید. Flow با ارائه کنترلهای پیشرفته دوربین، ابزار Scenebuilder برای ویرایش و گسترش نماها، و دسترسی به کتابخانه محتوای Flow TV، فرآیند فیلمسازی را دموکراتیزه کرده و به موج جدیدی از خلاقیت در میان تولیدکنندگان محتوا دامن میزند.
-
H3: NotebookLM: یادداشتبرداری هوشمند با قابلیتهای جدید و شگفتانگیز خلاصهسازی ویدیویی و صوتی NotebookLM، اپلیکیشن یادداشتبرداری و پژوهشی مبتنی بر هوش مصنوعی گوگل، با افزودن قابلیتهای جدید و بسیار کاربردی، از جمله امکان تولید خلاصههای ویدیویی از اسناد (Video Overviews) و همچنین خلاصههای صوتی (Audio Overviews) بهروزرسانی شد. این ویژگی به کاربران اجازه میدهد تا منابع مختلفی، از جمله ویدیوهای یوتیوب (به عنوان مثال، سخنرانیهای کلیدی رویداد I/O 2025)، لینکهای وبلاگها و اطلاعیههای مطبوعاتی را در NotebookLM بارگذاری کرده و از این ابزار برای درک بهتر، عمیقتر و سریعتر اخبار و اطلاعات رویداد استفاده کنند. کاربران میتوانند از طریق یک نقشه ذهنی (Mind Map) پویا، بخش پرسش و پاسخ (FAQ) تولید شده توسط AI یا یک نمای کلی صوتی (Audio Overview) به کاوش در معرفی های Google I/O بپردازند و یا سوالات مشخصی مانند "مهمترین معرفیهای اندروید در I/O 2025 چه بودند؟" را از NotebookLM بپرسند و خلاصههایی در فرمتهای مختلف، مثلاً "یک پست اجتماعی در مورد آخرین اخبار Gemini برای من پیشنویس کن"، دریافت نمایند. این قابلیتها، NotebookLM را به ابزاری بینظیر و قدرتمند برای پژوهشگران، دانشجویان، روزنامهنگاران و هر کسی که با حجم زیادی از اطلاعات متنی و چندرسانهای سروکار دارد، تبدیل میکند.
پیشرفتهای چشمگیر و نوآورانه در پلتفرم اندروید و اکوسیستم گسترده و پویای آن
گوگل در I/O 2025 نشان داد که به توسعه و ارتقای پلتفرم اندروید و اکوسیستم آن، با تمرکز ویژه بر هوش مصنوعی و تجارب کاربری نوین، ادامه میدهد.
Android XR: ادغام واقعیت توسعهیافته (XR) با هوش مصنوعی قدرتمند و چندوجهی Gemini گوگل در این رویداد تأکید ویژهای بر پیشرفتهای پلتفرم Android XR داشت که برای نسل جدید هدستهای واقعیت مجازی (VR) و عینکهای واقعیت افزوده (AR) طراحی شده است. نسخه Developer Preview 2 برای Android XR SDK منتشر شد و خبر از گسترش اکوسیستم دستگاههای سازگار، از جمله هدست بسیار مورد انتظار Project Moohan سامسونگ که اواخر سال جاری میلادی عرضه میشود، داده شد.
گوگل همچنین همکاری نزدیک خود را با سامسونگ در زمینه توسعه این هدست، که به عنوان رقیبی جدی برای Apple Vision Pro مطرح است، رسماً تأیید کرد. دموهای ارائهشده از عینکهای هوشمند مجهز به هوش مصنوعی Gemini، قابلیتهای شگفتانگیزی نظیر نمایش پیامها و نوتیفیکیشنها به صورت شناور در میدان دید، شناسایی هوشمند سوژهها و اشیاء در عکسها، به خاطر سپردن مکانهای بازدید شده قبلی (مانند یک کافیشاپ خاص)، ارائه مسیرهای پیادهروی به صورت واقعیت افزوده، و ایجاد رویدادهای تقویم همراه با دعوت از دیگران را به نمایش گذاشت.
این عینکها با گوشی هوشمند کاربر کار میکنند و دسترسی به اپلیکیشنها و اطلاعات را بدون نیاز به استفاده از دست و با تعامل صوتی یا حرکتی فراهم میآورند و Gemini را مستقیماً به میدان دید و تجربه روزمره کاربر میآورند. برندهای مطرح عینکسازی مانند Gentle Monster و Warby Parker به عنوان اولین شرکا برای عرضه عینکهایی مبتنی بر Android XR معرفی شدند و سامسونگ نیز در آینده نزدیک به این جمع خواهد پیوست. شرکت Xreal نیز از Project Aura، دومین دستگاه رسمی مبتنی بر Android XR که یک عینک واقعیت افزوده سبک و متصل به سیم است، رونمایی کرد. این عینکها از چیپست قدرتمند Qualcomm Snapdragon XR بهره میبرند و با هوش مصنوعی Gemini یکپارچه شدهاند. این سرمایهگذاری مجدد و گسترده گوگل در حوزه XR، پس از تجربیات قبلی مانند Google Glass، نشاندهنده باور عمیق این شرکت به پتانسیل عظیم ترکیب واقعیت توسعهیافته با هوش مصنوعی پیشرفته Gemini برای ایجاد تجارب کاربری کاملاً جدید و متحولکننده است.
-
H3: Material 3 Expressive: زبان طراحی جدید، پویاتر، زندهتر و شخصیسازیشدهتر برای اکوسیستم گوگل گوگل از Material 3 Expressive، نسخه جدید، بهبودیافته و بسیار پر جنب و جوشتر زبان طراحی خود، رونمایی کرد. هدف اصلی از این بهروزرسانی، ارائه جلوههای بصری غنیتر، پالتهای رنگی گستردهتر و شخصیسازیشدهتر، و انیمیشنها و حرکتهای روانتر و پویاتر برای رابطهای کاربری در سراسر پلتفرمهای اندروید، Wear OS و مجموعه گسترده اپلیکیشنهای گوگل است. این زبان طراحی جدید بر ایجاد تجربههای کاربری که نه تنها زیبا و کارآمد هستند، بلکه احساسیتر، پویاتر و جذابتر نیز باشند، تأکید دارد و به توسعهدهندگان امکان میدهد تا اپلیکیشنهایی با هویت بصری منحصربهفردتر و هماهنگتر با قابلیتهای هوشمند جدید خلق کنند.
-
Wear OS 6: گامی بلند و مهم به جلو برای دستگاههای پوشیدنی هوشمند گوگل و شرکای آن آخرین نسخه سیستمعامل دستگاههای پوشیدنی گوگل، یعنی Wear OS 6، به طور رسمی در I/O 2025 معرفی شد. این نسخه جدید، زبان طراحی مدرن و پویای Material 3 Expressive را به طور برجسته و کامل در خود جای داده و همچنین کتابخانههای جدید و کارآمدی از مجموعه Jetpack را برای سادهسازی و تسریع فرآیند توسعه اپلیکیشن برای دستگاههای پوشیدنی در اختیار توسعهدهندگان قرار میدهد. یکی از مهمترین خبرها، ادغام رسمی هوش مصنوعی Gemini در Wear OS بود. البته، درخواستها و پردازشهای مرتبط با Gemini در فضای ابری انجام خواهند شد، به این معنی که ساعتهای هوشمند برای بهرهمندی از این قابلیتها به اتصال اینترنت (از طریق تلفن همراه متصل، Wi-Fi یا شبکه LTE خود ساعت) نیاز خواهند داشت. این پیشرفتها نشاندهنده عزم گوگل برای تبدیل Wear OS به پلتفرمی جذابتر، قدرتمندتر و رقابتیتر در بازار رو به رشد دستگاههای پوشیدنی هوشمند است.
-
اندروید ۱۶: نگاهی گذرا به آینده اندروید با رابط کاربری دسکتاپ و یکپارچگی عمیقتر با هوش مصنوعی اگرچه جزئیات کامل اندروید ۱۶ بیشتر در رویداد Android Show هفته قبل از I/O معرفی شده بود، اما در کنفرانس اصلی نیز به برخی از ویژگیهای کلیدی آن اشاره شد. یکی از مهمترین این ویژگیها، معرفی یک رابط کاربری دسکتاپ (Desktop UI) است که گوگل آن را با الهام و بر پایه تجربیات موفق Samsung DeX توسعه داده است. اندروید ۱۶ بر سه ستون اصلی استوار خواهد بود: بازنگری قابل توجه و گسترده در رابط کاربری با پیادهسازی کامل Material 3 Expressive، پشتیبانی عمیقتر و گستردهتر از هوش مصنوعی Gemini در دستگاههای بیشتر و در سطوح مختلف سیستمعامل، و ارائه ابزارها و قابلیتهای پیشرفتهتر برای افزایش ایمنی و حفظ حریم خصوصی کاربران.
ابزارها، پلتفرمها و APIهای جدید و قدرتمند برای توانمندسازی جامعه جهانی توسعهدهندگان
گوگل در I/O 2025 مجموعه گسترده و متنوعی از ابزارها، SDKها و APIهای جدید و بهروز شده را با تمرکز ویژه بر هوش مصنوعی برای جامعه جهانی توسعهدهندگان معرفی کرد تا آنها را در ساخت نسل بعدی اپلیکیشنها و تجارب هوشمند، بیش از پیش توانمند سازد.
-
به روزرسانی های کلیدی و استراتژیک برای Gemini API و SDK: قدرت بیشتر، انعطاف پذیری بالاتر
نسخه بهروز شده و بهبودیافته Gemini 2.5 Flash Preview با عملکرد بسیار قویتر در وظایف مرتبط با کدنویسی و استدلالهای پیچیده، و همچنین بهینهسازی شده برای سرعت و کارایی بالاتر، معرفی شد.
ابزارهای جدیدی مانند URL Context به Gemini API اضافه شد که به مدل امکان میدهد محتوای کامل و زمینه صفحات وب را تنها با دریافت یک لینک، درک و پردازش کند.
Gemini API و SDK اکنون از پروتکل زمینه مدل (Model Context Protocol - MCP) پشتیبانی میکنند که استفاده از طیف وسیعی از ابزارها و سرویسهای متنباز را برای توسعهدهندگان به طور قابل توجهی آسانتر و یکپارچهتر میکند.
قابلیت فراخوانی ناهمزمان توابع (Asynchronous Function Calling) به توسعهدهندگان اجازه میدهد توابع یا ابزارهای طولانیمدت و زمانبر را در پسزمینه فراخوانی کنند، بدون اینکه جریان اصلی مکالمه یا عملکرد اپلیکیشن مسدود شود.
Computer Use API (که در حال حاضر در مرحله آزمایش با معتمدین و شرکای منتخب قرار دارد) به توسعهدهندگان امکان ساخت اپلیکیشنهایی را میدهد که میتوانند تحت هدایت و با اجازه کاربر، وب را مرور کرده، با سایر ابزارهای نرمافزاری تعامل داشته و وظایف پیچیدهای را به صورت خودکار انجام دهند. این مجموعه بهروزرسانیها نشان میدهند که گوگل به طور جدی به دنبال تسهیل ساخت "عاملهای هوشمند" (AI agents) و اپلیکیشنهای عاملمحور توسط توسعهدهندگان است.
-
ML Kit GenAI APIs با قدرت Gemini Nano: هوش مصنوعی چندوجهی و کارآمد بر روی خود دستگاه APIهای جدید ML Kit GenAI با استفاده از مدل سبک و کارآمد Gemini Nano برای انجام وظایف رایج هوش مصنوعی به صورت روی دستگاه (on-device)، بدون نیاز به اتصال دائمی به اینترنت، معرفی شدند. این وظایف شامل خلاصهسازی هوشمند متون، تصحیح گرامر و نگارش، و سایر قابلیتهای پردازش زبان طبیعی است. Gemini Nano با ارائه حریم خصوصی بیشتر (چون دادهها از دستگاه خارج نمیشوند)، تأخیر بسیار کمتر در پاسخگویی و هزینه پایینتر، قابلیتهای چندوجهی و هوشمند را مستقیماً به دستگاههای کاربران، به ویژه گوشیهای هوشمند اندرویدی، میآورد.
-
Firebase AI Logic: ادغام ساده و یکپارچه مدلهای هوش مصنوعی مولد گوگل در اپلیکیشنهای شما سرویس Firebase AI Logic به توسعهدهندگان پلتفرم Firebase امکان میدهد تا به طور ساده و یکپارچه، مدلهای هوش مصنوعی مولد قدرتمند گوگل، از جمله مدلهای خانواده Gemini Pro و مدل تصویرساز Imagen را مستقیماً در اپلیکیشنهای موبایل و وب خود ادغام کرده و از قابلیتهای آنها بهره ببرند. این امر فرآیند توسعه اپلیکیشنهای هوشمند را برای جامعه بزرگ توسعهدهندگان Firebase به طور قابل توجهی تسریع بخشیده و موانع ورود به دنیای هوش مصنوعی را برای آنها کاهش میدهد.
-
AI Edge Portal: مرکزی برای آزمایش و بنچمارک مدلهای هوش مصنوعی روی دستگاه شما AI Edge Portal به عنوان یک منبع و پلتفرم جدید برای توسعهدهندگان معرفی شد که به آنها امکان میدهد مدلهای هوش مصنوعی طراحیشده برای اجرا روی دستگاه (on-device) خود را به راحتی آزمایش کرده، عملکرد آنها را بنچمارک نموده و برای پلتفرمهای مختلف بهینهسازی کنند.
-
گسترش خانواده مدل های تخصصی و متن باز Gemma: از پزشکی تا زبان اشاره و حتی ارتباط با دلفینها! خانواده مدلهای زبان بزرگ متنباز (Open-Source) و سبک Gemma گوگل با معرفی چندین مدل تخصصی و بسیار جالب گسترش یافت:
MedGemma: به عنوان تواناترین مدل باز گوگل برای درک متن و تصویر در حوزه پزشکی معرفی شد و برای کمک به توسعه اپلیکیشنهای نوآورانه در زمینه سلامت و بهداشت طراحی شده است.
SignGemma: یک مدل باز آیندهنگرانه برای ترجمه زبانهای اشاره (در حال حاضر با بهترین عملکرد در ترجمه زبان اشاره آمریکایی به انگلیسی) به متن گفتاری است که هدف آن ایجاد اپلیکیشنها و یکپارچهسازیهای جدید برای توانمندسازی کاربران ناشنوا و کمشنوا میباشد.
DolphinGemma: شاید یکی از شگفتانگیزترین معرفیها، DolphinGemma بود؛ اولین مدل زبان بزرگ جهان که برای درک و تحلیل الگوهای ارتباطی دلفینها طراحی شده است! این مدل با همکاری محققان Georgia Tech و پروژه Wild Dolphin بر روی دادههای جمعآوری شده از چندین دهه تحقیق میدانی آموزش دیده است. توسعه این مدلهای Gemma تخصصی، نشاندهنده تعهد گوگل به استفاده از هوش مصنوعی برای حل مشکلات خاص در حوزههای مهم اجتماعی، علمی و حتی زیستمحیطی، و همچنین توانمندسازی جوامع خاص و پیشبرد مرزهای دانش با استفاده از مدلهای متنباز است.
-
سایر ابزارها و بهروزرسانیهای کلیدی برای توانمندسازی هرچه بیشتر توسعه دهندگان:
Stitch: ابزاری نوآورانه و انقلابی برای طراحی بصری رابط کاربری (UI) که با استفاده از پیشنهادات طراحی هوشمند و مبتنی بر AI، نویدبخش تحولی شگرف در نحوه ایجاد رابطهای کاربری زیبا و کارآمد توسط توسعهدهندگان است.
تجربه Colab عاملمحورتر: گوگل وعده یک تجربه Colab کاملاً جدید و عاملمحور (Agent-centric) را داد که میتواند وظایف را از طریق درک و اجرای دستورات زبان طبیعی، به طور هوشمندانه انجام دهد.
Jules Coding Assistant: دستیار کدنویسی مستقل و قدرتمند گوگل، Jules، اکنون در نسخه بتای عمومی قرار گرفته و در دسترس توسعهدهندگان بیشتری است.
Gemini Code Assist: نسخههای Standard برای افراد و همچنین نسخه مخصوص GitHub اکنون به طور عمومی در دسترس هستند و از قدرت مدل پیشرفته Gemini 2.5 برای کمک به کدنویسی بهره میبرند.
پیشرفتهای Baseline در ابزارهای توسعه: وضعیت Baseline اکنون در ابزارهایی مانند VS Code نمایش داده میشود و با دادههای کاربران واقعی ترکیب میگردد تا به توسعهدهندگان در انتخاب هدف بهینه Baseline برای مخاطبان و اپلیکیشنهایشان کمک کند.
LiteRT: برای دستیابی به حداکثر کارایی و سادهسازی در پیادهسازی هوش مصنوعی در لبه (AI Edge) و دستگاههای موبایل معرفی شد.
سایر معرفیهای قابل توجه و نوآوریهای فراتر از نرمافزار در Google I/O 2025
علاوه بر بهروزرسانیهای نرمافزاری و مدلهای هوش مصنوعی، گوگل از چند پروژه سختافزاری و ابتکار عمل مهم دیگر نیز رونمایی کرد:
Google Beam (پروژه Starline سابق): تماسهای ویدیویی سهبعدی و واقعگرایانه با قدرت هوش مصنوعی و ترجمه همزمان Google Beam (که پیشتر با نام رمز Project Starline شناخته میشد) به عنوان یک پلتفرم ارتباطات ویدیویی پیشرفته و مبتنی بر هوش مصنوعی (AI-first) معرفی شد. این سیستم شگفتانگیز از یک مدل ویدیویی پیشرفته برای تبدیل جریانهای ویدیویی دوبعدی استاندارد به یک تجربه سهبعدی کاملاً واقعگرایانه و سهبعدی (بدون نیاز به عینک خاص) با استفاده از مجموعهای از شش دوربین و یک نمایشگر میدان نوری سهبعدی (3D Light-field Display) بهره میبرد. این سیستم، ردیابی سر تقریباً بینقص و بسیار دقیقی را با دقت میلیمتری و با سرعت ۶۰ فریم در ثانیه ارائه میدهد که منجر به ایجاد حس حضور واقعی و ارتباط چهره به چهره بسیار طبیعی میشود.
یکی از قابلیتهای بسیار هیجانانگیز در حال توسعه برای Beam، ترجمه همزمان گفتار (Real-time Speech Translation) است که به کاربران امکان میدهد حتی اگر به زبانهای مختلفی صحبت میکنند، مکالمهای روان، طبیعی و بدون مانع زبانی داشته باشند. این قابلیت در Google Meet نیز با پشتیبانی اولیه از زبانهای انگلیسی و اسپانیایی برای مشترکین طرحهای AI Pro و Ultra در نسخه بتا عرضه میشود. برای بهرهمندی از قابلیت تبدیل ویدیوی دوبعدی به مدل سهبعدی، سختافزار اختصاصی مانند نمایشگری از شرکت HP با شش دوربین یکپارچه مورد نیاز است. اولین دستگاههای تجاری Google Beam اواخر سال ۲۰۲۵ در دسترس قرار خواهند گرفت. Google Beam نشاندهنده گام بلند بعدی گوگل در تکامل ارتباطات ویدیویی و تلاش برای ایجاد تعاملاتی بسیار غنیتر، فراگیرتر و انسانیتر است.
-
SynthID Detector: ابزاری جدید و حیاتی برای تشخیص محتوای تولید شده توسط هوش مصنوعی و مقابله با اطلاعات نادرست گوگل در پاسخ به نگرانیهای فزاینده در مورد انتشار اطلاعات نادرست، اخبار جعلی و دیپفیکهای (Deepfakes) تولید شده توسط هوش مصنوعی، از SynthID Detector رونمایی کرد. این یک پورتال وب جدید و در دسترس عموم است که برای شناسایی اینکه آیا محتوای صوتی، تصویری، متنی یا ویدیویی توسط ابزارهای هوش مصنوعی خود گوگل تولید شده است یا خیر، طراحی شده است. SynthID با جاسازی یک واترمارک دیجیتال نامرئی و مقاوم در محتوای تولید شده توسط AI گوگل عمل میکند. این ابزار میتواند به افزایش شفافیت، پاسخگویی و اعتماد در فضای آنلاین کمک شایانی کند، هرچند اثربخشی نهایی آن به میزان پذیرش گسترده، توانایی آن در تشخیص محتوای تولید شده توسط سایر ابزارهای AI و همچنین روشهای احتمالی برای دور زدن آن بستگی خواهد داشت.
-
بهروزرسانیهای مهم و کلیدی در حوزه امنیت و حفظ حریم خصوصی کاربران در عصر هوش مصنوعی گوگل بر تعهد خود به امنیت و حریم خصوصی کاربران تاکید کرد و از چند بهروزرسانی مهم در این زمینه خبر داد:
مدیر رمز عبور مرورگر کروم (Chrome's Password Manager) اکنون به طور خودکار و هوشمندانه، رمزهای عبوری را که تشخیص داده شده در نشتهای اطلاعاتی به خطر افتادهاند، برای کاربر تغییر میدهد.
مدلهای خانواده Gemini 2.5 با پادمانها و لایههای امنیتی پیشرفتهتری عرضه شدهاند که نرخ محافظت در برابر حملات تزریق پرامپت غیرمستقیم (Indirect Prompt Injection Attacks) را به طور قابل توجهی افزایش داده و آنها را به امنترین خانواده مدلهای Gemini تاکنون تبدیل کرده است. این بهروزرسانیها نشاندهنده اهمیت فزاینده امنیت سایبری و حفاظت از دادههای حساس کاربران در عصر هوش مصنوعی است که در آن، تهدیدات نیز به طور مداوم در حال پیچیدهتر شدن هستند.
-
گسترش همکاریهای استراتژیک گوگل در حوزه خودروهای هوشمند و عینکهای پیشرفته واقعیت توسعهیافته گوگل به گسترش نفوذ هوش مصنوعی و پلتفرمهای خود به حوزههای جدید ادامه میدهد:
شرکت خودروسازی ولوو (Volvo) قراردادی را برای قرار دادن و ادغام عمیق هوش مصنوعی Gemini در نسل بعدی خودروهای خود با گوگل امضا کرده است.
همانطور که پیشتر در بخش Android XR ذکر شد، گوگل همکاری خود را با برندهای مطرح و مدگرای عینکسازی مانند Gentle Monster و Warby Parker برای ایجاد عینکهای هوشمند و شیک مبتنی بر Android XR آغاز کرده و شرکت Kering Eyewear (مالک برندهایی چون گوچی و سن لوران) نیز در آینده نزدیک به این جمع خواهد پیوست. این همکاریها نشان میدهد که گوگل به دنبال ایجاد یک اکوسیستم هوش مصنوعی فراگیر و یکپارچه است که تمامی جنبههای زندگی کاربر، از گوشی هوشمند و کامپیوتر شخصی گرفته تا خودرو و دستگاههای پوشیدنی را در بر میگیرد.
جمعبندی نهایی و نگاهی به آینده درخشان و پر از چالش پیش روی گوگل در عصر طلایی هوش مصنوعی
کنفرانس Google I/O 2025 به وضوح و با قدرتی تمام نشان داد که هوش مصنوعی دیگر یک مفهوم آیندهنگرانه یا یک پروژه جانبی برای گوگل نیست، بلکه به هسته اصلی، استراتژی بنیادین و نیروی محرکه تمامی فعالیتها و نوآوریهای این غول فناوری تبدیل شده است. گوگل با معرفی مجموعهای از پیشرفتهای خیرهکننده و گسترده در مدلهای خانواده Gemini، ابزارهای نوین برای توسعهدهندگان، قابلیتهای انقلابی در جستجوی هوشمند، تولید محتوای چندرسانهای خلاقانه و پلتفرم اندروید و اکوسیستم آن، چشمانداز بلندپروازانه خود را برای آیندهای که در آن هوش مصنوعی نقشی محوری، یکپارچه و همهجانبه در زندگی ما ایفا میکند، با جسارت تمام ترسیم کرد. شعار "از پژوهش به واقعیت" و تمرکز ویژه بر "دستیارهای هوشمند" و "عاملهای AI" نشاندهنده بلوغ این فناوری و آمادگی کامل گوگل برای ارائه راهحلهای عملی، کاربردی و ارزشآفرین به میلیاردها کاربر و میلیونها توسعهدهنده در سراسر جهان است. معرفی اشتراکهای جدید Google AI Pro و به ویژه Google AI Ultra، گامی مهم در جهت تجاریسازی و ارائه ارزش متمایز به کاربران حرفهای و سازمانی است.
با این حال، همانطور که این فناوریهای نوین قدرتمندتر، پیچیدهتر و فراگیرتر میشوند، سوالات بسیار مهمی نیز در مورد پیامدهای اخلاقی، حفظ حریم خصوصی، امنیت دادهها، تأثیرات اجتماعی و اقتصادی (مانند جابجایی مشاغل)، و لزوم ایجاد چارچوبهای نظارتی مسئولانه مطرح میگردد. چالشهایی مانند تشخیص دقیق و قابل اعتماد محتوای تولید شده توسط AI، جلوگیری از سوءاستفاده از ابزارهای قدرتمند تولید محتوا برای انتشار اطلاعات نادرست یا دیپفیکهای مخرب، و مدیریت مسئولانه دادههای شخصی و حساس کاربران در عصر دستیارهای هوشمند همهچیزدان، مسائلی هستند که نه تنها گوگل، بلکه کل صنعت فناوری و جامعه جهانی باید به طور جدی به آنها پرداخته و راهحلهای پایداری برایشان بیابند.
در نهایت، Google I/O 2025 نه تنها مجموعهای از محصولات، سرویسها و ویژگیهای جدید و هیجانانگیز را به نمایش گذاشت، بلکه بیش از هر چیز، جهتگیری استراتژیک، قدرت فنی و جاهطلبی بیحد و مرز گوگل را در رقابت فزاینده و نفسگیر هوش مصنوعی به تصویر کشید. موفقیت این شرکت در تحقق وعدههای بلندپروازانه خود و همچنین مدیریت هوشمندانه و مسئولانه چالشهای عظیم پیش رو، بدون شک آینده تعامل ما با فناوری و حتی مسیر تکامل جامعه بشری را در دهههای آینده شکل خواهد داد. بذرهای انقلاب هوش مصنوعی توسط گوگل و سایر پیشگامان این عرصه کاشته شدهاند؛ اکنون زمان آن است که با دقت، آیندهنگری و مسئولیتپذیری جمعی، از رشد و شکوفایی آنها مراقبت کنیم تا به جای گرفتار شدن در جنگلی از پیچیدگیها و خطرات تکنولوژیک، از باغی پرثمر، سرشار از فرصت و پیشرفت برای همگان بهرهمند شویم. هایورت (hiwert.com) با افتخار این مسیر پر از شگفتی را همراه با شما دنبال خواهد کرد.