|
@@ -0,0 +1,102 @@
|
|
|
+---
|
|
|
+title: "如何使用Nano Banana"
|
|
|
+tags: ["Ai"]
|
|
|
+categories: ["Ai"]
|
|
|
+image: "https://www.techspot.com/images2/news/bigimage/2025/08/2025-08-27-image-6.jpg"
|
|
|
+url: "/news/how-to-use-nano-banana"
|
|
|
+date: 2025-08-29T00:00:10+08:00
|
|
|
+description: "如何使用Nano Banana"
|
|
|
+draft: false
|
|
|
+display: true
|
|
|
+type: "blog"
|
|
|
+---
|
|
|
+
|
|
|
+ Google 的 **Gemini 2.5 Flash Image**,又稱 **Nano Banana**,是一款突破性的 AI 圖像生成和編輯模型,具備多項引人注目的特點。它被譽為全球評分最高的圖像編輯模型之一,旨在提供使用者強大且直覺的圖像創作與修改能力。
|
|
|
+
|
|
|
+ 以下是 Nano Banana 的主要特點:
|
|
|
+
|
|
|
+ * **卓越的角色與物件一致性**
|
|
|
+ * 這是 Nano Banana 最受推崇的特點。它能在多輪編輯和指令中,**完美保留人物的五官比例、臉型輪廓、表情和整體外貌**,讓角色始終保持一致,避免過去 AI 圖像生成常見的「走鐘」問題。
|
|
|
+ * 這項能力使其特別適合品牌素材、漫畫角色、遊戲人物創作以及個人形象設計。
|
|
|
+
|
|
|
+ * **強大的自然語言生成與編輯能力**
|
|
|
+ * 使用者只需透過**簡單、自然的文字指令**,即可進行圖像生成和精準的編輯,無需繁瑣的選區或遮罩。
|
|
|
+ * 支援**多輪對話式編輯**,可以像與編輯師對話一樣,逐步細化圖像,進行增、刪、改等操作,每次修改都能保持其他元素的完整性。
|
|
|
+
|
|
|
+ * **多功能圖像編輯**
|
|
|
+ * **局部修改**:可替換背景、改變色調、調整姿勢、增添或移除元素,例如改變服裝、髮型、表情,移除照片中的人物或物件。
|
|
|
+ * **多圖像融合與合成**:能夠理解並合併多張圖像,例如將多個元素組合成單一場景,或將產品融入新的設計版面,甚至為兩人生成合照。
|
|
|
+ * **風格轉換**:可將圖像內容轉換為不同的藝術風格,同時保留原始構圖。
|
|
|
+ * **舊照片修復與上色**:能為老舊的黑白照片增添細節、重新上色,賦予其新的生命。
|
|
|
+ * **縮小圖像視野(Outpainting)**:可以向外延伸照片,以包含更多的場景和環境,同時保持內容一致。
|
|
|
+
|
|
|
+ * **理解現實世界與推理能力**
|
|
|
+ * Nano Banana 結合了 Gemini 的**世界知識和推理能力**,使其生成的圖像更符合現實世界的邏輯,並能理解手繪圖表、解決問題。
|
|
|
+
|
|
|
+ * **高效率與高品質輸出**
|
|
|
+ * **生成速度快**:通常在 5 到 15 秒內即可完成圖像生成。
|
|
|
+ * **圖像細膩與擬真度高**:在膚色、光影層次、動態表現等方面具有優勢,輸出品質細膩逼真。
|
|
|
+ * **高提示詞遵循度**:能夠準確地執行提示詞中的指令,只改變指定的部分,並保持其他元素的連貫性。
|
|
|
+ * **文字渲染精準**:能夠在圖像中準確渲染清晰、排版良好的文字,非常適合製作標誌、圖表和海報。
|
|
|
+
|
|
|
+ * **多種應用場景**
|
|
|
+ * 適用於個人形象設計 (如改變髮型、服裝、背景、生成 LinkedIn 或 Tinder 照片)、產品廣告和電商 (如產品模擬、客製化模型)、社群媒體內容創作 (如生成 YouTube 縮圖、AI 網紅貼文)、室內設計規劃、遊戲資產製作 和故事板/漫畫分鏡。
|
|
|
+
|
|
|
+ * **內建安全機制 (SynthID 數位浮水印)**
|
|
|
+ * 為確保 AI 生成內容的透明度和可追溯性,所有透過 Gemini 應用程式生成或編輯的圖像都會包含一個可見浮水印,以及**隱形的 SynthID 數位浮水印**。
|
|
|
+ * **值得注意的是**,有一則來源提到 Gemini 2.5 Flash Image 不內建 SynthID 數位浮水印,這與多數來源,包括 Google 官方文件,的說法相矛盾。
|
|
|
+
|
|
|
+ * **Pixel 手機離線運行**
|
|
|
+ * 在 Pixel 手機上,Gemini Nano 作為內建的 AI 助理,甚至能在沒有網路連線的情況下運行部分 AI 功能。
|
|
|
+
|
|
|
+ **一些限制與不足**
|
|
|
+ 儘管功能強大,Nano Banana 仍存在一些限制:
|
|
|
+ * **輸出解析度**:有時輸出圖像的解析度會降低,細節和清晰度可能不如輸入圖像或某些其他模型。
|
|
|
+ * **風格化處理**:對於高度風格化的圖像(如像素藝術、黏土動畫),效果可能不佳,更擅長處理寫實風格。
|
|
|
+ * **偶爾產生不自然結果**:在某些情況下,可能會生成不自然的面部表情、身體比例失調,或出現意想不到的元素(例如多出一隻手)。
|
|
|
+ * **無法生成透明背景**:目前不支援生成具有透明背景的圖像。
|
|
|
+ * **嚴格的內容審核**:對內容有較高的審核標準,難以生成不安全或不適宜的內容。
|
|
|
+
|
|
|
+
|
|
|
+ 使用者和開發者可以透過多種管道免費或付費使用 Google 的 Gemini 2.5 Flash Image 模型,又稱 **Nano Banana**。
|
|
|
+
|
|
|
+ 以下是主要的存取方式:
|
|
|
+
|
|
|
+ **免費使用管道**
|
|
|
+
|
|
|
+ 1. **Gemini 應用程式 (Gemini App)**
|
|
|
+ * 使用者可以在 **Gemini 應用程式** 中直接使用 Nano Banana 的圖像編輯功能。
|
|
|
+ * 只需在工具箱底部選擇「圖像」,然後點選「建立圖像」,並確保已選擇 2.5 Flash 模型即可。
|
|
|
+ * 此功能已整合到 Gemini 應用程式中,並且正在逐步向使用者推出,在應用程式的圖片選項旁可能會有香蕉圖示。
|
|
|
+ * 在 Pixel 手機上,Gemini 作為內建的 AI 助理,其中包含的 Gemini Nano 甚至能在沒有網路連線的情況下運行。
|
|
|
+ * 在 Gemini 應用程式中建立或編輯的所有圖像都會包含一個可見的浮水印,以及一個**隱形的 SynthID 數位浮水印**,以明確標示其為 AI 生成內容。
|
|
|
+
|
|
|
+ 2. **Google AI Studio**
|
|
|
+ * 這是一個由 Google 推出的雲端平台,專門用於測試、體驗和使用 Gemini 系列 AI 模型。
|
|
|
+ * 使用者可以前往 `https://gemini.google.com/app` 或 `https://aistudio.google.com/`,選擇 **Gemini 2.5 Flash Image Preview 模型**,然後切換到「圖像」功能來**免費使用**。
|
|
|
+ * Google AI Studio 還提供預設的模板和應用程式,讓使用者能夠快速測試模型功能。
|
|
|
+ * 在 Google AI Studio 生成的所有圖像都會**自動加入 SynthID 隱形浮水印**,以確保 AI 內容的透明度和可追溯性。
|
|
|
+
|
|
|
+ 3. **Alamarina (LM Arena)**
|
|
|
+ * Alamarina 是 Nano Banana 最初發布前進行測試的網站。目前,這個平台提供 Nano Banana 的**無限次免費使用,且沒有浮水印**。
|
|
|
+ * 使用者可以透過盲測模式,上傳圖像並輸入提示詞,平台會生成兩張對比圖,投票後才能揭曉是哪個模型生成了最佳結果,其中之一很可能就是 Nano Banana。
|
|
|
+
|
|
|
+ **付費使用管道**
|
|
|
+
|
|
|
+ 1. **Gemini API**
|
|
|
+ * 開發者可以透過 **Gemini API** 將 Nano Banana (Gemini 2.5 Flash Image Preview 模型) 整合到自己的應用程式中。
|
|
|
+ * API 支援多種程式語言,包括 Python、JavaScript、Java、Go 和 REST。
|
|
|
+ * **計費方式**:每百萬輸出代幣收費 **$30.00**,每個圖像被代幣化為 1290 個輸出代幣,因此每個圖像大約為 **$0.039 (3.9 美分)**。
|
|
|
+ * 使用 API 需要一個 Google Cloud 帳戶和 API 金鑰。免費層級提供有限的請求,而付費方案則可擴展用於生產環境。
|
|
|
+ * 所有透過 Gemini API 生成或編輯的圖像都會包含**隱形的 SynthID 數位浮水印**。
|
|
|
+
|
|
|
+ 2. **Vertex AI**
|
|
|
+ * **Vertex AI** 適用於企業級使用者,提供託管端點,能夠為高吞吐量的應用程式擴展 Nano Banana 的使用。
|
|
|
+ * 同樣需要 Google Cloud 帳戶並啟用 Vertex AI API。
|
|
|
+
|
|
|
+ 3. **Freepick (及其他訂閱服務)**
|
|
|
+ * 某些第三方服務,如 Freepick,提供 Nano Banana 的付費訂閱,以實現**無限圖像生成**,並提供選擇長寬比及一次輸出多個圖像等在免費服務中可能沒有的功能。Premium Plus 方案被推薦用於無限圖像生成。
|
|
|
+
|
|
|
+ **關於 SynthID 浮水印的說明:**
|
|
|
+ 值得注意的是,儘管多個來源(包括 Google 官方文件)明確指出所有透過 Gemini 2.5 Flash Image (Nano Banana) 生成或編輯的圖像都會包含**隱形的 SynthID 數位浮水印**,以確保 AI 內容的透明度和可追溯性,但有一則來源提到 Gemini 2.5 Flash Image 不內建 SynthID 數位浮水印。由於大多數來源和 Google 官方開發者指南都確認了 SynthID 的存在,因此應將其視為內建的安全措施。
|
|
|
+
|