هوش مصنوعی Gemini 1.5 گوگل با پیشرفتی عظیم در فهم و استدلال چندوجهی رسماً معرفی شد

0 2 خواندن این مطلب 2 دقیقه زمان میبرد

پس از انتشار Gemini 1.0 در ماه دسامبر، گوگل به‌تازگی Gemini 1.5 را به‌عنوان مدل نسل بعدی هوش مصنوعی خود با عملکرد بسیار بهبودیافته معرفی کرده است.

هوش مصنوعی Gemini 1.5 گوگل

یکی از پیشرفت‌های اصلی Gemini 1.5 یک پنجره زمینه به‌طور قابل‌توجهی بزرگتر است.

پنجره زمینه مدل جدید هوش مصنوعی از توکن‌ها تشکیل شده است که بلوک‌های ساختمانی مورداستفاده برای پردازش اطلاعات هستند. توکن‌ها می‌توانند تمام بخش‌ها یا زیربخش‌هایی از کلمات، تصاویر، ویدیوها، صدا یا کد باشند. هرچه پنجره زمینه یک مدل بزرگتر باشد، اطلاعات بیشتری را می‌تواند در یک اعلان داده دریافت و پردازش کند و خروجی آن را سازگارتر، مرتبط‌تر و مفیدتر می‌کند.

Gemini 1.5 Pro دارای یک پنجره زمینه استاندارد با 128000 توکن (در مقابل 32000 توکن برای Gemini 1.0) است. این میزان به بیش از 700 هزار کلمه، پایگاه کد با بیش از 30 هزار خط کد، 11 ساعت صدا یا 1 ساعت ویدیو ترجمه می‌شود. GPT-4 Turbo نیز شامل 128 هزار توکن است و Claude 2.1 200 هزار توکن را ارائه می‌دهد. نمونه‌هایی از این میزان توکن در عمل عبارتند از:

Gemini 1.5 Pro می‌تواند به‌طور یکپارچه حجم زیادی از محتوا را در یک درخواست خاص تجزیه‌وتحلیل، طبقه‌بندی و خلاصه کند. برای مثال، وقتی رونوشت‌های 402 صفحه‌ای از مأموریت آپولو 11 به ماه داده می‌شود، می‌تواند درباره مکالمات، رویدادها و جزئیات موجود در سند استدلال کند.

Gemini 1.5 Pro می‌تواند وظایف بسیار پیچیده‌ای را برای درک و استدلال روش‌های مختلف ازجمله ویدیو انجام دهد. به‌عنوان‌مثال، زمانی که یک فیلم 44 دقیقه‌ای بی‌صدا باستر کیتون به این مدل داده می‌شود، می‌تواند نقاط و رویدادهای مختلف داستان را به‌دقت تحلیل کند و حتی درباره جزئیات کوچک فیلم که به‌راحتی از دست می‌رود، استدلال کند.

Gemini 1.5 Pro می‌تواند وظایف حل مسئله مرتبط‌تری را در بلوک‌های طولانی‌تر کد انجام دهد. هنگامی که درخواستی با بیش از 100 هزار خط کد به شما داده می‌شود، بهتر می‌تواند در بین مثال‌ها استدلال کرده، تغییرات مفیدی را پیشنهاد کند و در مورد نحوه عملکرد بخش‌های مختلف کد توضیحاتی ارائه دهد.

هوش مصنوعی Gemini 1.5 گوگل

قسمت قابل‌توجه این است که گوگل تا 1 میلیون توکن تولید کرده است و آن را در اختیار برخی از آزمایش‌کنندگان اولیه قرار می‌دهد، درحالی‌که همزمان تا 10 میلیون توکن متن را نیز با موفقیت آزمایش کرده است.

این پیشرفت‌ها با معماری جدید Mixture-of-Experts (MoE) امکان‌پذیر می‌شوند که در آن مدل‌ها «به شبکه‌های عصبی متخصص کوچک‌تر تقسیم می‌شوند. این باعث می‌شود Gemini 1.5 هم برای آموزش و هم برای سرویس‌دهی کارآمدتر باشد.

بسته به نوع ورودی داده‌شده، مدل‌های MoE یاد می‌گیرند که به‌طور انتخابی فقط مرتبط‌ترین مسیرهای خبره را در شبکه عصبی خود فعال کنند. این تخصص، کارایی مدل را به‌شدت افزایش می‌دهد.

ازنظر عملکرد، Gemini 1.5 Pro نسبت‌به Gemini 1.0 Pro در 87 درصد از معیارها در ارزیابی‌های متن، کد، تصویر، صدا و ویدئو بهتر است. حتی در سطح گسترده‌ای مشابه، نسخه 1.5 هم‌سطح با 1.0 Ultra عمل می‌کند.

Gemini 1.5 Pro همچنین مهارت‌های چشمگیر «یادگیری درون‌متنی» را نشان می‌دهد، به این معنی که می‌تواند یک مهارت جدید را از اطلاعات داده‌شده در یک اعلان طولانی، بدون نیاز به تنظیم دقیق اضافی بیاموزد.

Gemini 1.5 Pro (پنجره زمینه شامل 128 هزار توکن) به‌عنوان یک پیش‌نمایش محدود برای توسعه‌دهندگان و مشتریان سازمانی از طریق AI Studio و Vertex AI در دسترس قرار می‌گیرد.

گوگل بیان کرده است که قصد دارد به‌زودی با بهبود مدل، سطوح قیمت‌گذاری را معرفی کند که از پنجره متنی استاندارد 128 هزار توکن شروع می‌کند و تا 1 میلیون توکن افزایش می‌یابد.

نظر شما درباره هوش مصنوعی Gemini 1.5 گوگل چیست؟

منبع: https://مایفون مگ.ir/2024/02/16/%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-gemini-1-5-%DA%AF%D9%88%DA%AF%D9%84-%D8%A8%D8%A7-%D9%BE%DB%8C%D8%B4%D8%B1%D9%81%D8%AA%DB%8C-%D8%B9%D8%B8%DB%8C%D9%85-%D8%AF%D8%B1-%D9%81%D9%87/

Updated: 2024-02-17 09:18:43

محمدصادق مجدی27 بهمن 1402

0 2 خواندن این مطلب 2 دقیقه زمان میبرد

هوش مصنوعی Gemini 1.5 گوگل با پیشرفتی عظیم در فهم و استدلال چندوجهی رسماً معرفی شد

هوش مصنوعی Gemini 1.5 گوگل

محمدصادق مجدی

دیدگاهتان را بنویسید لغو پاسخ

در هتلهایی که بر روی ارزش تمرکز دارند, صبحانه های رایگان بزرگتر میشوند

بستنی ساز شکلات رایگان

مشخصات پژو 207 با موتور TU3 توسط ایران خودرو منتشر شد: موتور پژو 206 تیپ 2

عقب گرد آقای بالمر مدیر عامل سابق مایکروسافت بر تکنولوژی لینوکس

تازه درگیر شده اید! فروش یکجا سهام بورس باعث نزول نرخ وام مسکن شد

iPad mini 6 با صفحه نمایش بزرگتر از قبل و قاب باریک تر که طبق ادعای گزارش جدید انتظار می رود در ماه مارس وارد بازار شود.

آیفون 12 محبوب ترین تلفن همراه مجهز به اینترنت 5G می شود و چهار برابر سهم بازار را مانند پرفروش ترین گوشی سامسونگ از آن خود کرده است.

آیفون تاشو توسط شرکت فاکسکان در حال آزمایش است و احتمال دارد در سپتامبر سال 2022 روانه بازار شود.

در آخرین نتایج Benchmark چیپست A14 Bionic عملکرد بهتری نسبت به چیپست Exynos 2100 گلکسی S21 الترا داشته است.

A14 Bionic اپل پرفروش ترین چیپست برای گوشی های هوشمند با صفحه نمایش AMOLED برای سه ماهه سوم سال 2020

انتظار نمی رود سری گوشی های آیفون 2022 به روزرسانی قابل توجهی نسبت به لنز دوربین داشته باشند.

هوش مصنوعی Gemini 1.5 گوگل

محمدصادق مجدی

ساخت ویدئو با هوش مصنوعی Sora واقعا هوش از سر شما می‌برد

ایربادز آنر Choice Earbuds X5 با ANC و عمر باتری 35 ساعته معرفی شد

نوشته های مشابه

تاریخ معرفی میزو ۲۱ پرو اعلام شد، آخرین گوشی این برند؟

پوکو X6 5G ری‌برند شده این گوشی Redmi خواهد بود

شیائومی 12 اولترا ماه آینده با باتری 5000 میلی آمپر ساعتی عرضه خواهد شد

افزایش تحریم امریکا روی صادرات تراشه‌های هوش مصنوعی به چین

دیدگاهتان را بنویسید لغو پاسخ

iPad mini 6 با صفحه نمایش بزرگتر از قبل و قاب باریک تر که طبق ادعای گزارش جدید انتظار می رود در ماه مارس وارد بازار شود.

آیفون 12 محبوب ترین تلفن همراه مجهز به اینترنت 5G می شود و چهار برابر سهم بازار را مانند پرفروش ترین گوشی سامسونگ از آن خود کرده است.

آیفون تاشو توسط شرکت فاکسکان در حال آزمایش است و احتمال دارد در سپتامبر سال 2022 روانه بازار شود.

در آخرین نتایج Benchmark چیپست A14 Bionic عملکرد بهتری نسبت به چیپست Exynos 2100 گلکسی S21 الترا داشته است.

A14 Bionic اپل پرفروش ترین چیپست برای گوشی های هوشمند با صفحه نمایش AMOLED برای سه ماهه سوم سال 2020

انتظار نمی رود سری گوشی های آیفون 2022 به روزرسانی قابل توجهی نسبت به لنز دوربین داشته باشند.