Gemini 2.0 Resmi Dirilis: Apa Saja Kelebihannya?
- blog.google.com
Gadget - Google kembali membuat gebrakan di dunia teknologi dengan meluncurkan model kecerdasan buatan terbaru mereka, Gemini 2.0, pada Rabu (11/12). Model ini membawa serangkaian fitur canggih yang dirancang untuk mendukung kebutuhan pengguna global dan developer dalam berbagai skenario, mulai dari text-to-speech hingga pembuat gambar. Apa saja kecanggihannya?
Gemini 2.0 Flash untuk Pengguna Global
Gemini 2.0 Flash telah tersedia dalam versi chatbot yang dapat digunakan oleh pengguna di seluruh dunia. Namun, untuk versi eksperimental multimodal, yang mendukung fitur text-to-speech, pembuat gambar, hingga input multimodal seperti video dan audio, akses sementara ini dibatasi untuk kalangan developer.
Google menyebut model ini sebagai flagship model mereka, dengan latensi rendah dan performa optimal pada skala besar. "Ini adalah model andalan kami, menggunakan teknologi tercanggih yang pernah kami kembangkan," ujar Google dalam keterangan resmi.
Penerapan di Berbagai Produk Google
Ke depan, Google berencana mengintegrasikan Gemini 2.0 ke lebih banyak produk mereka. Model ini tidak hanya mempermudah pengguna dengan kemampuan chatbot, tetapi juga mampu menangani pertanyaan dan tugas kompleks seperti:
- Penalaran Matematis Tingkat Lanjut: Membantu pengguna menyelesaikan persamaan rumit.
- Kueri Multimodal: Menggabungkan data teks, gambar, dan suara.
- Eksekusi Kode dan Pengkodean: Membantu developer memecahkan masalah teknis.
Google juga mengumumkan bahwa pembaruan ini akan mulai diterapkan secara luas tahun depan.
Proyek Inovatif Google: Project Astra, Mariner, dan Jules
Google menguji coba kemampuan Gemini 2.0 melalui berbagai prototipe penelitian. Beberapa proyek utama yang sedang dijalankan adalah:
- Project Astra: Prototipe asisten AI universal yang menjanjikan pengalaman pengguna lebih cerdas dan adaptif.
- Project Mariner: Menjelajahi masa depan interaksi antara manusia dan AI, dimulai dari aplikasi browser.
- Jules: Asisten AI untuk pengkodean, dirancang untuk membantu developer bekerja lebih efisien.
Selain itu, Google juga menjajaki penerapan Gemini 2.0 ke domain baru seperti video game dan robotik.
Fitur Multimodal Canggih di Gemini 2.0 Flash
Gemini 2.0 Flash hadir dengan kemampuan unik untuk mendukung input dan output multimodal. Beberapa fitur utamanya meliputi:
- Kombinasi Teks dan Gambar: Menghasilkan output native yang menggabungkan teks dan visual.
- Audio Multibahasa: Mendukung text-to-speech dengan kontrol multibahasa.
- Alat Eksekusi Real-Time: Termasuk Google Search dan alat pihak ketiga yang dapat didefinisikan pengguna.
Fitur ini dirancang untuk meningkatkan produktivitas pengguna dan developer dengan menghadirkan pengalaman yang lebih dinamis.
Gemini API dan Multimodal Live API untuk Developer
Google juga merilis Gemini API melalui Google AI Studio dan Vertex AI, memungkinkan developer untuk mengakses model ini secara eksperimental. Selain itu, fitur Multimodal Live API menawarkan:
- Audio Real-Time: Input suara langsung.
- Streaming Video: Mendukung video sebagai input secara real-time.
- Penggunaan Alat Kombinasi: Mempermudah developer menciptakan aplikasi interaktif dan dinamis.
Google menegaskan komitmennya untuk memberikan teknologi yang aman dan mudah diakses kepada publik. Bulan lalu, mereka telah menerima masukan dari developer terkait versi awal Gemini 2.0 dan akan terus memperbaiki model ini.