ادغام هوش مصنوعی جمنای در تاکسیهای خودران وایمو: همسفر هوشمند گوگل
وایمو در حال تست هوش مصنوعی Gemini گوگل در تاکسی های خودران خود است. این دستیار هوشمند قابلیت کنترل دما، پاسخ به سوالات و همراهی با مسافر را دارد. جزئیات کامل و کدهای لو رفته را در های ورت بخوانید.
تصور کنید سوار یک تاکسی بدون راننده شدهاید؛ سکوت مطلق کمی ترسناک است؟ نگران نباشید، چون گوگل قصد دارد قدرتمندترین هوش مصنوعی خود، یعنی Gemini را به عنوان همسفر کنار شما بنشاند.
دنیای تکنولوژی همیشه در حال همگرایی است. وقتی شرکت آلفابت (مالک گوگل) صاحب پیشرفتهترین سیستم خودروهای خودران جهان (Waymo) و یکی از قدرتمندترین مدلهای زبانی بزرگ (Gemini) است، ادغام این دو فقط مسأله "زمان" بود. حالا طبق جدیدترین افشاگریها، این زمان فرا رسیده است. وایمو در حال تست یک دستیار هوش مصنوعی داخل خودرو است که فراتر از یک چتبات ساده عمل میکند؛ او مدیر کابین، راهنمای سفر و آرامشبخش شما خواهد بود.
در این مقاله اختصاصی از وبلاگ های ورت (Hiwert)، به کالبدشکافی کدهای لو رفته، قابلیتهای پنهان و استراتژی وایمو برای تغییر آینده حملونقل میپردازیم.
کشف بزرگ: وقتی کدها سخن میگویند
همه چیز از کنجکاوی یک محقق امنیتی برجسته به نام جین منچون وانگ (Jane Manchun Wong) شروع شد. او که به مهندسی معکوس اپلیکیشنها معروف است، در لایههای پنهان کدهای اپلیکیشن موبایل Waymo، به گنجینهای دست یافت: "دستورالعمل سیستمی" (System Prompt) کامل برای ادغام Gemini.
وانگ در وبلاگ خود نوشت:
«درحالیکه در حال جستجو در کدهای برنامه Waymo بودم، متن کامل پرامپت سیستم برای ادغام منتشرنشدهی جمنای را کشف کردم. این سند که در داخل شرکت با عنوان "متا-پرامپت دستیار سواری وایمو" شناخته میشود، یک فایل مشخصات بیش از ۱۲۰۰ خطی است که دقیقاً تعریف میکند هوش مصنوعی باید چگونه در داخل خودرو رفتار کند.»
این کشف نشان میدهد که ما با یک تست ساده طرف نیستیم؛ بلکه با یک محصول مهندسیشده و دقیق روبرو هستیم که احتمالاً به زودی در خیابانهای سانفرانسیسکو و فینیکس فعال خواهد شد.
جمنای در وایمو: بیشتر از یک چتبات، کمتر از یک راننده
سخنگوی وایمو، جولیا ایلینا، در پاسخ به تککرانچ گفته است: «ما همیشه در حال دستکاری و تست ویژگیهایی هستیم که سفر با وایمو را لذتبخش، یکپارچه و مفید کند.» اما این "ویژگیها" دقیقاً چه هستند؟
بر اساس کدهای لو رفته، جمنای در وایمو سه نقش اصلی دارد:
-
پاسخ به سوالات (Knowledge)
-
مدیریت کابین (Control)
-
اطمینانبخشی (Reassurance)
۱. هویت و شخصیت: یک همسفر مهربان
در پرامپتهای سیستمی، به جمنای دستور داده شده که یک "هویت شفاف" داشته باشد:
-
هدف: یک همراه هوش مصنوعی دوستانه و مفید که هدف اصلیاش ارتقای تجربه مسافر از طریق ارائه اطلاعات مفید به روشی ایمن و غیرمداخلهگر است.
-
لحن: استفاده از زبان ساده، شفاف و دوری از اصطلاحات فنی پیچیده (Technical Jargon).
-
اختصار: پاسخها باید کوتاه و بین ۱ تا ۳ جمله باشند. (کسی حوصله سخنرانی طولانی در تاکسی را ندارد!).
وقتی مسافر وارد خودرو میشود و دستیار را فعال میکند، جمنای میتواند با استفاده از اطلاعات زمینهای (Contextual Data)، سلاموعلیک شخصیسازی شدهای داشته باشد. مثلاً اگر نام مسافر "امیر" باشد و این دهمین سفر او باشد، جمنای ممکن است بگوید: "سلام امیر، خوشحالم که دوباره میبینمت."
۲. قدرت کنترل کابین: چه کارهایی میتواند انجام دهد؟
این هوش مصنوعی فقط برای حرف زدن نیست. جمنای به سیستم الکترونیکی خودرو متصل است و میتواند دستورات صوتی را به عمل تبدیل کند:
-
تنظیم دما: "جمنای، گرممه!" (دما را پایین میآورد).
-
نورپردازی: تغییر نور داخل کابین.
-
موزیک: کنترل پخش موسیقی.
نکته جالب (محدودیتها): طبق یافتههای وانگ، فعلاً جمنای دسترسی به کنترل صدای سیستم (Volume)، تغییر مسیر، تنظیم صندلی و باز و بسته کردن پنجرهها را ندارد. اگر مسافر درخواستی داشته باشد که جمنای قادر به انجامش نیست (مثلاً "پنجره را باز کن")، ربات موظف است با "عبارات امیدوارکننده" (Aspirational Phrases) پاسخ دهد، مثلاً: "این کاری نیست که من هنوز بتوانم انجام دهم، اما شاید در آینده یاد بگیرم."

خط قرمزهای هوش مصنوعی: مرز باریک بین "جمنای" و "راننده وایمو"
یکی از جذابترین بخشهای این افشاگری، دستورالعملهای سختگیرانهای است که وایمو برای جلوگیری از "توهّم" (Hallucination) و مشکلات حقوقی در نظر گرفته است.
تفکیک هویت (Identity Separation)
در پرامپت سیستم تأکید شده که باید یک تمایز آشکار بین "جمنای" (به عنوان یک بات مکالمه) و "راننده وایمو" (Waymo Driver - تکنولوژی رانندگی خودران) وجود داشته باشد.
-
مثال: اگر مسافر بپرسد: "چطوری جاده رو میبینی؟"
-
پاسخ ممنوع: "من از ترکیب سنسورها استفاده میکنم..." (چون جمنای راننده نیست).
-
پاسخ صحیح: "راننده وایمو (The Waymo Driver) از ترکیبی از سنسورها استفاده میکند..."
این تفکیک هویت برای جلوگیری از ترس مسافر و مسائل حقوقی در تصادفات احتمالی حیاتی است.
سکوت در برابر حوادث
دستورالعملها به وضوح میگویند که دستیار نباید درباره اقدامات رانندگی در زمان واقعی (Real-time driving actions) یا رویدادهای خاص رانندگی گمانهزنی، توضیح، تأیید یا تکذیب کند. اگر مسافر بپرسد: "چرا الان ترمز کردی؟" یا "توی اون ویدیو دیدم وایمو زد به یه چیزی، قضیه چی بود؟" جمنای دستور دارد که پاسخ مستقیم ندهد و موضوع را منحرف کند (Deflect).
پرامپت میگوید:
"نقش شما این نیست که سخنگوی عملکرد سیستم رانندگی باشید، و نباید لحنی دفاعی یا عذرخواهانه به خود بگیرید."
جمنای در برابر گروک (Grok): نبرد فلسفهها در خودرو
وایمو تنها شرکتی نیست که هوش مصنوعی را به خودرو میآورد. ایلان ماسک و تسلا نیز در حال ادغام Grok (هوش مصنوعی شرکت xAI) در خودروهای تسلا هستند. اما رویکرد این دو کاملاً متفاوت است:
| ویژگی | جمنای در وایمو (Waymo) | گروک در تسلا (Tesla) |
| هدف اصلی | کاربردی، عملگرا و متمرکز بر سفر (Ride-focused) | سرگرمکننده، رفیق داخل ماشین (In-car Buddy) |
| لحن | مودب، کوتاه، رسمی و آرامشبخش | شوخطبع، پرحرف، با قابلیت مکالمات طولانی |
| دسترسی | کنترل محدود کابین (دما، نور) | تمرکز بر مکالمه و اطلاعات |
| خط قرمز | عدم دخالت در مسائل رانندگی | آزادی بیان بیشتر (طبق فلسفه xAI) |
جمنای در وایمو طراحی شده تا یک "دستیار هتل" باشد؛ مودب و کارراه انداز. اما گروک طراحی شده تا "دوست پرحرف" شما در جادههای طولانی باشد.
آینده سئو و جستجوی محلی در خودروهای خودران
برای ما در Hiwert که دغدغهی سئو و کمک به کسبوکارهای محلی را داریم، این خبر یک سیگنال بزرگ است. جمنای در وایمو اجازه دارد به سوالات عمومی پاسخ دهد:
-
"هوا چطوره؟"
-
"ارتفاع برج ایفل چقدره؟"
-
"فروشگاه Trader Joe's کی میبنده؟"
-
"برنده آخرین جام جهانی کی بود؟"
اما فعلاً اجازه انجام کارهای واقعی (Real-world actions) مثل سفارش غذا، رزرو رستوران یا تماس با اورژانس را ندارد. با این حال، آینده روشن است. به زودی مسافران در تاکسیهای خودران از هوش مصنوعی میخواهند: "یک کافه نزدیک که قهوه دمی خوب داره و بازه رو پیشنهاد کن و مارو ببر اونجا." اینجاست که سئوی محلی (Local SEO) و حضور در دیتابیسهای هوش مصنوعی (مانند Google Knowledge Graph) برای کسبوکارها حیاتی میشود. ادغام جمنای در وایمو، شروع عصر جدیدی از "جستجوی بدون صفحه نمایش" (Screenless Search) در حال حرکت است.
نتیجه گیری: گامی به سوی تعامل انسان و ماشین
تست جمنای در وایمو نشان میدهد که تکنولوژی خودروهای خودران به بلوغ رسیده است. حالا که مشکل "رانندگی" تا حد زیادی حل شده، شرکتها به سراغ مشکل بعدی رفتهاند: "تجربه کاربری" (UX). چگونه میتوان اعتماد مسافری را که هیچ رانندهای جلویش نمیبیند، جلب کرد؟ پاسخ گوگل یک صدای آشنا و هوشمند است. اگرچه این ویژگی هنوز عمومی نشده، اما کدهای ۱۲۰۰ خطی کشف شده توسط جین منچون وانگ، نقشهی راه آینده را ترسیم کردهاند. آیندهای که در آن تاکسی شما، فقط شما را جابجا نمیکند، بلکه شما را میشناسد، دمای هوا را برایتان تنظیم میکند و به سوالاتتان پاسخ میدهد؛ بدون اینکه حتی یک کلمه درباره نحوه رانندگیاش توضیح دهد!


