Model gambar AI "Banana" terbaru dari Google membuat netizen ramai bermain "Vibe Photoshoping"

Bitget App

Trading lebih cerdas

Bitget

Berita

MarsBit2025/08/30 06:53

Tampilkan aslinya

Oleh:TechFlow

Google AI Studio telah merilis Gemini 2.5 Flash Image (kode nama nano-banana), model generasi dan pengeditan gambar paling canggih dari Google yang menawarkan kecepatan tinggi dan performa luar biasa di berbagai peringkat. Ringkasan ini dihasilkan oleh Mars AI Ringkasan ini dibuat oleh model Mars AI, dan keakuratan serta kelengkapan kontennya masih dalam tahap pembaruan iteratif.

Masih ingat model pengedit gambar AI misterius "nano-banana" yang sebelumnya ramai dibicarakan? Saat itu, di LMArena, arena kompetisi model bahasa besar, model ini sempat menjadi topik hangat berkat performanya yang luar biasa. Para ahli teknologi dari Google Gemini juga bergantian tampil, menggoda rasa penasaran publik di media sosial, bahkan sempat dikira sebagai Gemini 3.0 Pro yang legendaris.

Kini, Google akhirnya mengungkap tabir misterinya.

Pada dini hari 27 Agustus waktu Asia Timur, Google AI Studio secara resmi meluncurkan Gemini 2.5 Flash Image (kode nama nano banana) 🍌.

Gemini 2.5 Flash Image yang sudah lama dinanti akhirnya hadir | Sumber gambar: GeekPark

Ini adalah model generasi dan pengeditan gambar paling canggih dari Google sejauh ini, bukan hanya sangat cepat—pengalaman yang benar-benar "secepat kilat"—tetapi juga meraih hasil SOTA di berbagai daftar peringkat, bahkan unggul jauh di LMArena.

Gemini 2.5 Flash Image langsung mencapai kemampuan SOTA saat diluncurkan | Sumber gambar: LMarena.ai

Dalam blog teknisnya, Google menyebutkan bahwa Gemini 2.0 Flash telah memenangkan hati para pengembang berkat latensi rendah dan efisiensi biaya tinggi, namun pengguna selalu mengharapkan kualitas gambar yang lebih baik dan kontrol kreatif yang lebih kuat. Gemini 2.5 Flash Image hadir dengan peningkatan besar: konsistensi karakter akhirnya dapat dipertahankan dengan baik, pengeditan gambar berbasis prompt menjadi lebih presisi, penggabungan beberapa gambar terasa alami dan mulus, serta pemahaman terhadap pengetahuan dunia nyata membuatnya bukan sekadar model, melainkan "titik awal" untuk aplikasi generasi berikutnya.

GeekPark juga langsung mencoba model ini. Yang mengejutkan, ini bukan sekadar pembaruan model, melainkan pertama kalinya terasa nyata bahwa masa depan pengeditan gambar AI sudah di depan mata.

Google AI Studio kini sudah membuka akses untuk mencoba | Sumber gambar: GeekPark

Awalnya, saya hanya ingin mencoba seperti biasa, "melihat seberapa cepat model baru ini". Namun, hanya dalam beberapa jam mencoba, saya seolah sudah mengintip wujud aplikasi populer generasi berikutnya.

Dulu kita terbiasa dengan alat seperti MeituPic, cukup klik tombol, pasang filter, foto langsung jadi lebih cantik. Tapi Gemini 2.5 Flash Image memberikan pengalaman yang benar-benar berbeda. Kecepatannya luar biasa, cerdas seperti desainer yang memahami keinginan Anda—cukup sebutkan efek yang diinginkan, dalam hitungan detik hasilnya langsung muncul.

Selain hasil, kecepatan juga menjadi pengalaman berbeda Gemini 2.5 Flash Image dibanding produk model generasi gambar sebelumnya | Sumber gambar: GeekPark

01 Generasi Super Cepat, Hasil dalam Hitungan Detik

Pengalaman paling nyata dari nano banana adalah kecepatannya. Biasanya saat menggunakan beberapa model open source, meski komputer Anda cukup mumpuni, dari memasukkan prompt hingga menghasilkan gambar layak, butuh puluhan detik atau bahkan lebih lama. Bagi pengguna ponsel, proses menunggu ini lebih menyiksa.

Tapi Gemini 2.5 Flash Image menurunkan ambang waktu ini hingga hanya beberapa detik saja. Model ini adalah model multimodal asli terbaru, tercepat, dan paling efisien yang diklaim Google, dengan optimasi yang jelas sangat serius. Dalam pengujian saya, memasukkan satu prompt, hasilnya keluar dalam tiga hingga empat detik, dengan resolusi dan detail yang sangat jelas. (UTC+8)

Pengalaman ini mirip dengan saat kita menggunakan MeituPic: klik tombol "beautify", efeknya langsung terlihat. Bedanya, MeituPic menggunakan algoritma untuk menerapkan filter, sedangkan Gemini 2.5 Flash Image membangun gambar dari nol, atau mengubah foto sesuai permintaan Anda secara drastis. Sensasi "langsung jadi" ini benar-benar tak terbayangkan dalam proses pengeditan gambar manual yang rumit sebelumnya.

Kebutuhan seperti "menghapus orang di latar belakang" kini cukup dengan satu prompt | Sumber gambar: GeekPark

Jika kecepatan menyelesaikan masalah pengalaman pengguna pengeditan gambar tradisional, maka "multimodal asli" memperluas batas kemampuan gambar AI.

Gemini 2.5 Flash Image tidak hanya dapat menghasilkan gambar, tetapi juga memahami input teks dan gambar secara bersamaan. Artinya, saya bisa mengunggah foto dan memberikan prompt teks sekaligus, dan model ini akan menggabungkan informasi keduanya untuk memahami keinginan saya.

Contohnya, saya mengunggah foto yang diambil di jalan, lalu memberi prompt "ubah latar belakang menjadi pemandangan malam Shinjuku, Tokyo". Hasilnya, model ini tidak hanya mengenali subjek utama dalam foto, tetapi juga secara akurat memisahkan orang dari latar belakang, lalu menggantinya dengan suasana neon khas Shinjuku. Yang lebih mengesankan, pencahayaan pada subjek tetap konsisten, tanpa efek "tempelan kasar" yang sering terjadi saat mengedit manual.

Kemampuan pemahaman seperti ini mengingatkan saya pada fitur "ganti latar belakang sekali klik" yang sering disebut di aplikasi galeri bawaan ponsel beberapa tahun terakhir. Bedanya, dulu hasilnya seringkali tepi buram, pencahayaan tidak pas, terlihat palsu. Sekarang, Gemini 2.5 Flash Image menggunakan pengetahuan dunia dan pemahaman visual untuk menyempurnakan detail, hasilnya jauh lebih alami dan detail gambar lebih terjaga dibanding alat text-to-image/image-to-image tradisional.

Gambar asli & hasil generasi Gemini 2.5 Flash Image | Sumber gambar: GeekPark

Inilah mengapa saya merasa model ini akan mendefinisikan ulang pengalaman mengedit gambar: tidak lagi bergantung pada banyak penyesuaian manual, melainkan mengandalkan pemahaman semantik alami model untuk menyelesaikan tugas secara efisien, misalnya pada pengeditan potret yang sangat menuntut detail.

Untuk kebutuhan pengeditan gambar potret seperti ini, konsistensi karakter Gemini 2.5 Flash Image benar-benar memberikan pengalaman "Vibe Photoshoping" yang belum pernah ada sebelumnya.

Satu detik membantu programmer "menyelamatkan harga diri" | Sumber gambar: GeekPark

Pengalaman ini mematahkan kesan lama banyak orang terhadap generasi gambar AI—"mistis": jika prompt Anda bagus, hasilnya menakjubkan; jika biasa saja, hasilnya bisa sangat melenceng.

Namun di Gemini 2.5 Flash Image, saya menemukan kesan "mistis" ini jauh berkurang. Pemahaman terhadap prompt jauh lebih presisi dan sesuai intuisi pengguna—itulah mengapa banyak orang merasa model ini jauh lebih mudah digunakan.

Misalnya, saya bilang "blur latar belakang, fokus pada subjek di depan", beberapa detik kemudian hasilnya persis seperti yang saya inginkan; saya minta "ubah ekspresi orang di foto jadi tersenyum", bukan hanya sudut bibir yang naik, bahkan tatapan mata pun disesuaikan, detailnya sangat tepat; saya bahkan mencoba "warnai foto hitam putih", hasil gambar berwarna yang dihasilkan tidak asal, tapi sedekat mungkin dengan nuansa warna foto sejarah aslinya.

Kemampuan "bicara langsung jadi" seperti ini mengingatkan saya pada pengalaman menggunakan MeituPic dulu: ingin menghaluskan kulit, tapi seluruh wajah malah jadi "super cantik" tidak alami. Sekarang, operasi Gemini 2.5 Flash Image sangat presisi dan terkontrol, benar-benar memahami keinginan Anda dan berusaha mewujudkannya seakurat mungkin.

02 Kemampuan Ditingkatkan, Sulit Kembali ke Cara Lama

Agar lebih jelas, saya sengaja membandingkannya dengan alat pengedit gambar mobile yang biasa saya gunakan sehari-hari.

Di Snapseed, jika ingin blur latar belakang, biasanya saya harus mengelilingi area subjek secara manual selama satu-dua menit, lalu mengatur tingkat blur. Meski sudah mahir, tetap saja harus bolak-balik mengedit.

Di MeituPic, meski ada fitur blur latar belakang sekali klik, seringkali tepi subjek juga ikut blur, hasilnya kurang alami.

Sedangkan di Gemini 2.5 Flash Image, saya hanya perlu satu kalimat, model ini otomatis mengenali batas antara subjek dan latar belakang, efek blur-nya alami, tanpa perlu edit ulang.

Perbandingan ini menunjukkan satu hal: Gemini 2.5 Flash Image membebaskan pengguna dari operasi rumit, menyerahkan lebih banyak pekerjaan pada model. Bagi orang awam, ini menurunkan ambang pengeditan gambar; bagi profesional, ini menghemat banyak waktu.

Setelah mencoba, kesan terbesar saya adalah Gemini 2.5 Flash Image bukan lagi sekadar alat pengedit gambar, melainkan lebih mirip "asisten cerdas".

Dulu, kita menggunakan MeituPic, artinya memakai kumpulan fitur yang sudah diprogram: filter, beautify, mosaik, setiap tombol punya fungsi sendiri. Anda harus memilih satu per satu, mengatur langkah demi langkah, sampai puas.

Sekarang, logika Gemini 2.5 Flash Image benar-benar berbeda. Anda tidak perlu lagi belajar cara kerja alat, cukup sampaikan kebutuhan Anda, model ini yang akan mengeksekusinya.

Perubahan ini tampak sepele, tapi sebenarnya mengubah total hubungan dalam proses pengeditan gambar. Dulu kita menyesuaikan diri dengan alat, sekarang alat yang menyesuaikan diri dengan kita. Cara interaksi seperti ini adalah cikal bakal bentuk aplikasi generasi berikutnya.

Saat ini, Gemini 2.5 Flash Image masih dalam tahap awal, mungkin masih ada batasan fitur. Namun kecepatan, pemahaman, dan akurasi yang ditampilkan sudah cukup membuat orang membayangkan masa depan.

Bagaimana jika digabungkan dengan MeituPic? Mungkin Anda membuka aplikasi, lalu berkata pada ponsel "tolong edit foto ini, buat kulitku lebih natural", beberapa detik kemudian hasilnya langsung keluar (UTC+8); mungkin saat traveling, Anda bilang "ubah cuaca jadi cerah", foto langsung berubah jadi cerah; bahkan dalam pengeditan video, Anda bisa mengubah suasana satu klip hanya dengan satu kalimat.

Cara seperti ini mungkin akan segera menjadi fitur utama pengeditan gambar di sistem operasi ponsel | Sumber gambar: Twitter

Inilah mengapa saya yakin model ini akan segera merevolusi alur kerja alat pengedit gambar, mendefinisikan "MeituPic" generasi berikutnya: bukan sekadar mengedit gambar, tapi membentuk ulang cara interaksi pengolahan gambar, menjadikan AI sebagai partner editing fotografi Anda.

Namun saat ini, Gemini 2.5 Flash Image belum bisa langsung menjadi aplikasi pengedit gambar massal yang siap pakai: bukan hanya karena tujuan utamanya masih pada generasi gambar, bukan penyesuaian minor pada gambar yang sudah ada, tetapi juga karena semua gambar yang dibuat atau diedit dengan Gemini 2.5 Flash Image akan mengandung watermark digital SynthID, untuk membantu platform konten sosial mengenali konten yang dihasilkan AI.

03 Titik Ledakan Aplikasi Populer

Coba pikirkan, MeituPic dulu bisa menjadi aplikasi nasional karena menyelesaikan masalah yang dihadapi semua orang dengan cara paling sederhana—membuat foto jadi lebih bagus.

Gemini 2.5 Flash Image, justru melangkah lebih jauh, mengubah kemampuan AI yang rumit menjadi pengalaman "hasil instan" yang bisa digunakan semua orang.

Saat pertama kali saya bilang "tolong blur latar belakang", dan beberapa detik kemudian hasilnya sudah rapi, saya langsung sadar: inilah titik awal ledakan aplikasi populer. Ini bukan sekadar model, tapi kemampuan dasar bagi banyak produk baru di masa depan.

Fitur AI ganti langit sekali klik yang sempat viral di kalangan pengguna ponsel beberapa tahun lalu | Sumber gambar: komunitas vivo

Mungkin beberapa tahun lagi, kita akan lupa kode nama Banana, tapi akan melihat semakin banyak alat pengedit gambar yang memungkinkan Anda "sebutkan saja keinginan, langsung terwujud", dan mungkin akan menjadi kenangan bersama generasi pengguna, seperti MeituPic dulu.

Hanya saja kali ini, AI akan membawa imajinasi kita lebih jauh lagi.

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Raih Token Baru

APR hingga 12%. Selalu aktif, selalu dapat airdrop.

Kunci sekarang!

Kamu mungkin juga menyukai

Apakah data non-farm bulan September akan kembali mengalami "penurunan besar", membuka pintu untuk "pemotongan suku bunga 50 basis poin"?

新浪财经•2025/08/30 13:38

Kacamata pintar terus mendapatkan katalis, produk baru Meta diperkirakan akan diluncurkan bulan depan, menyoroti tata letak industri perusahaan A-share

新浪财经•2025/08/30 13:37

Daftar Terbaru Top 100 Aplikasi AI Global: ChatGPT di Peringkat Pertama, Google Mengejar dengan Cepat di Posisi Kedua, Alibaba Quark Melonjak ke Posisi Kesembilan

新浪财经•2025/08/30 13:37

Mengapa "tarif timbal balik" Trump dinyatakan "ilegal"? Apa yang akan terjadi selanjutnya?

老虎证券•2025/08/30 12:17

Berita trending

Lainnya

Apakah data non-farm bulan September akan kembali mengalami "penurunan besar", membuka pintu untuk "pemotongan suku bunga 50 basis poin"?

Kacamata pintar terus mendapatkan katalis, produk baru Meta diperkirakan akan diluncurkan bulan depan, menyoroti tata letak industri perusahaan A-share