跳至主要内容

離線 AI 好爽(2026 年版)

· 閱讀時間約 6 分鐘

2024 年九月時,我寫過一篇〈離線 AI 好爽!〉。

當時我剛買了兩張 NVIDIA RTX 4000,興奮地把各種離線 AI 工具都玩了一輪──Ollama 上的 Gemma 2 和 Llama 3.1 語言模型、FLUX.1 圖片生成、Whisper 語音辨識、Demucs 音樂分軌、Krita + Stable Diffusion 輔助修圖。

一年半過去了,現在的離線 AI 發展得如何了呢?暴雷:一切都進步超級多!

Qwen3-TTS:離線語音複製、生成

先來玩個遊戲。聽聽看以下兩個語音片段,猜猜看哪一個是我的真人錄音,哪一個只是打字讓 AI 生成的?

「你現在聽到的這段話,可能真的是我說的,也有可能是 AI 在模仿我說話。現在的科技真可怕,我都快要分不出來了。」

片段 1:



片段 2:


點我看答案

片段 1 是 AI 生成,片段 2 才是真的我。是不是很像!

Qwen3-TTS 這個東西太強了,它只需要一段 30 秒的語音樣本,就能複製你的聲音,用你的聲音說任何話。它可以完全離線、單機執行,訓練和生成都超級快,在我的電腦上只要幾秒到十幾秒就可以完成了。

所以,以後如果你聽到「我」在講一些很荒謬的言論,記得那可能不是我喔!

ACE-Step 1.5:離線音樂生成

去(2025)年十月,我介紹過 ACE-Step 這個離線音樂生成模型。當時我對它的評價是:「拍子有點怪怪的,好像樂手突然會抽筋一下的感覺,但是作為創意發想工具還不錯」。

還沒過半年,現在 ACE-Step 1.5 版推出了!這一版的「抽筋現象」已經比之前好非常非常多,聲音品質也明顯提升了好幾個等級。以我的體感來說,現在的品質大約已經相當於早期版本的 Suno,只落後它一年左右吧。

它開放原始碼,可以完全離線、單機執行,可以自訂歌詞和風格。跑起來超級快,在我的電腦上只需十幾秒就能生成一首 90 秒的歌曲。

來聽聽看它生成的音樂,風格設定為「jazz fusion」,歌詞是以下這樣:

Wiwi Blog 🎵 Wiwi Blog 🎵
我今天想要吃蛋餅
蛋餅蛋餅我的蛋餅
老闆加蛋,老闆加兩個蛋
只有蛋和餅,不要加醬油膏



我覺得以離線單機模型來說,這品質很令人驚豔耶!照這個速度發展下去,我猜不用一年,我們就能擁有跟當前的 Suno 一樣厲害的離線模型可以用了!到時候每個人都可以在自己的電腦上,離線免費生成超高品質的蛋餅歌,多麼令人期待的未來呀!

FLUX.2 Klein 9B:大人的離線圖片編輯、生成工具

FLUX.2 Klein 9B 是一個可以離線、單機執行的圖片生成與編輯模型。只要丟一張照片進去,然後用文字描述你想要它變成怎樣就可以了!

我覺得這個比線上的 Nano Banana 好用太多!Nano Banana 的審查機制之荒謬,根本是把使用者當成幼稚園小朋友,我只不過是想把照片修瘦一點它都不讓我耶!就更別提其他政治更不正確的請求了,用起來超廢的。

(Nano Banana:「你的身材很好,不准修改!」)

離線的 FLUX.2 Klein 可就完全不同了!它完全聽命於你,不論你想要生成各種政治不正確的、有版權疑慮的、母湯的、色色的圖片都沒有問題唷!輸出的圖全部存在自己的電腦上,不會被別人監控,太快樂了!

(左邊是原圖,右邊是 FLUX.2 Klein 的輸出)

(天氣越來越熱了,來吃西瓜吧!)

Ollama:很夠用的小型語言模型

跟一年半前相比,2026 年的離線語言模型也增強了一個等級。我現在最常用的模型是 Qwen3.5 27B 和 Gemma 3 27B,都是透過 Ollama 執行。

跟 Claude Opus 或 Gemini 3 Pro 這種付費版的旗艦模型比,當然還是有差距。但跟許多免費版的線上模型比的話,其實表現不相上下唷!我甚至覺得這兩個 27B 的小模型寫出來的文章,比免費版的 ChatGPT 更好。

如果你的需求主要是輔助寫作、翻譯、整理重點等文字工作,2026 年的離線模型已經完全夠用。寫程式也比兩年前進步很多,雖然還沒辦法像 Claude Opus 那樣可以直接完成超大專案,但是寫些小東西還是沒問題的!

線上 AI 越強,你越需要離線 AI

聽起來很矛盾,但是邏輯很簡單:線上 AI 越強,你就會越依賴它;你越依賴它,就越沒有對它說不的餘地。然後哪天它突然大漲價、加入更多內容審查、順便把你最依賴的功能鎖起來,你除了乖乖接受什麼都做不了。

如果生活上已經離不開 AI,更應該在自己的電腦上留一條完全離線、開放原始碼、不受任何公司控制的「後路」。離線 AI 不一定要比線上的強,光是「它永遠在那裡、不會變、不會漲價、不會審查你」這件事本身,就已經有超大的價值。

當雲端 AI 服務集體大便化、網路斷線、條款說改就改──注意是「當」,不是「如果」──你會很慶幸自己電腦上還有一個會聽你的話、能唱蛋餅歌、能生出可疑圖片的 AI 助手陪著你。

Vibe Playing

· 閱讀時間約 3 分鐘

Vibe Coding(憑感覺寫程式)大概是 2025 年開始最紅的軟體開發方式──程式碼都是 AI 寫的,人類不知道它寫了什麼、用了什麼邏輯、也不想了解,反正能夠跑就好。這種「我不懂,但我不 care」的態度,也是 Vibe Coding 受到批評的主要原因。

我突然想到,古典鋼琴圈不是一直以來都在 Vibe Playing 嗎?為了在升學考或音樂比賽裡「不輸給別人」,老師叫學生硬練遠超過自身程度的曲子,這在台灣的音樂班是常態。作曲家寫了什麼、用了什麼邏輯、為什麼要這樣寫,通通不重要──能夠彈得很快、不要錯音、聽起來很厲害就好。

而且仔細想,古典音樂教育體制其實是超級鼓勵 Vibe Playing 的。比賽和考試拿高分的標準通常是「彈得出來、彈得正確、彈得流暢」,沒有一個項目叫做「請解釋一下剛才這段作曲家做了什麼設計」。這不就很像寫程式時,只管它「能不能跑」的感覺嗎?

Wi-fi 搭訕法

假設你完全不懂中文。你的 AI 助理告訴你,想認識一個女生,你就走過去對她說:

「請問你是 Wi-fi 嗎?我感覺我們之間有連線。」

AI 跟你保證「只要講這句,她一定會笑」。你完全不知道這句話是什麼意思,你敢在不查證、不理解的情況下直接講出來嗎?

這就是許多鋼琴學生每天在做的事:譜上說彈這個音、老師說這裡漸強、那裡踩踏板,學生全部照做,但完全不知道為什麼。本質上,這就是在講自己也不知道意思的話,只是流利地講出來。

說服力

評論古典鋼琴演奏時,「有說服力」或「沒有說服力」是很常見的說法。

小時候我曾經對這個詞感到困惑──是要用鋼琴說服誰?但長大就懂了。這並不是在指演奏者裝得一副很有自信、表情扭曲、身體搖得很用力的樣子。外表再怎麼裝模作樣都是沒用的。

所謂的「說服力」,是指讓聽眾感受到:「這個人完全知道譜上寫了什麼,知道作曲家有這個意圖──而且沒錯,他知道譜上沒有這樣寫、大家也不是這樣彈的──但他就是決定要這樣詮釋。」是懂了之後做出的決定,不是蒙在鼓裡的憑感覺彈。

Vibe Playing 的相反,就是「說服力」。

沒人能搞懂任何事

不過話說回來,一個非鋼琴專業聽眾,八成聽不出來彈奏者是不是在 Vibe Playing。我身為一個非資訊專業者,在使用一個程式時,其實也不 care 開發者到底懂不懂裡面的每一行程式碼,能用就好了。

會不會有一天,工具變得太方便,導致世界上沒有人能搞懂任何事呢?每個人都只是複製貼上 AI 的話、執行自己看不懂的程式碼、演奏著自己不理解的音符。一切只要憑感覺就可以運作良好了──直到 Wi-fi 斷線的那一天

請問你是 Wi-fi 嗎?因為少了你,我才發現我什麼都不懂。

手滑

· 閱讀時間約 1 分鐘

嗚嗚嗚我的 Starbucks 馬克杯! 🫗

「00」遊戲

· 閱讀時間約 4 分鐘

看到 Ikuka 這篇〈指針式時鐘的必要性〉,她提到自己現在戴的是有 Hello Kitty 底圖的傳統指針手錶(你們可以自己連過去看圖)。還說每當朋友問她時間,她把手腕伸過去時,對方的反應往往是:「我看不懂啦!」。

(誰在乎現在幾點呢?這時正確的反應應該是:「哇你這 Hello Kitty 錶也太少女、太可愛了吧!」你看我是不是有學到一點點 F 人的說話方式了?)

我才意識到,好久沒有看到別人戴傳統指針手錶了耶!

我記得我小時候都是喜歡戴數字錶的,就是 Casio 那種黑色液晶數字、有碼表、錶面上還會號稱自己「防水 50 公尺」的款式(但我連水下 1 公尺都不想下去)。長大之後嫌電子錶太「孩子氣」,於是改戴 Swatch 假裝自己是個有品味的大人。

(大概從高中還是大學開始戴、用來裝成熟的 Swatch)

更之後我有很長一段時間都不戴手錶,因為根本不會出門要看時間就看電腦或手機就好啦。最近兩年開始跑步之後,才開始戴 Garmin,好好用喔我超級推薦它!

不過以上不是重點。這篇是想要分享小時候我會把碼表當作電動玩具,玩「嘗試把小數點後面兩個數字按成 00」的遊戲,一玩就可以很久。不覺得按中「00」的時候很滿足嗎?

所以,以下放了一個直接可以玩的版本,快來挑戰按到「00」吧!

00:00.00

我不會受影響啦(但你會)

· 閱讀時間約 3 分鐘

我頭腦可清楚的,怎麼可能受影響:

  • 📺 「新聞會讓人焦慮?那是別人抗壓性差,我不會受影響啦。」
  • 💳 「手遊會課金成癮?那是別人意志力不夠,我不會受影響啦。」
  • 📱 「常滑短影音會變笨?那是別人太不自制,我不會受影響啦。」
  • 🛍️ 「網購折扣會讓人衝動消費?那是別人腦波弱,我不會受影響啦。」
  • 📡 「看 XYZ 台會被某政黨洗腦?那是別人沒判斷力,我不會受影響啦。」
  • 🌿 「跟 YouTuber 團購會被割韭菜?那是別人太好騙,我不會受影響啦。」
  • 📸 「IG 會讓人覺得自己過得很差?那是別人心理脆弱,我不會受影響啦。」
  • ⚖️ 「Threads 會讓人越來越憤世嫉俗?那是別人容易被情緒帶著走,我不會受影響啦。」

不!你會受影響!我也會!大家都會!

第三人效果

這種心理有個專有名詞,叫做「第三人效果(Third-person effect)」,是社會學家 W. Phillips Davison 在 1983 年提出的概念。靈感來自二戰時的事件:

日軍向硫磺島1上的黑人美軍士兵空投傳單,內文大意是:「我們跟你們又沒仇,幹嘛為了那些白人賣命呢?」。黑人士兵們看了其實沒什麼反應。

反倒是美軍的白人指揮官看到傳單之後,心裡想:「這傳單對我當然沒影響,但那些黑人士兵看了之後,說不定真的會開始懷疑、動搖、甚至逃跑⋯⋯」

於是指揮官自己下令把部隊徹走了。

指揮官自以為這傳單「只對別人(旗下的黑人士兵)有影響」,但事實上這傳單對他們根本沒影響,反而是直接影響了自己的軍事決策。

你才會受影響

如果所有人都認為「自己比一般人更不容易受媒體影響」,這在數學上就不可能成立。一定有一半的人會落在中位數以下。

「我不會受影響啦」這句話本身,就是受影響最深的症狀。

讀完這篇文章之後,你可能會想:「原來還有這種認知偏誤啊!幸好我現在知道了,這樣以後就不會受影響了!」──恭喜你,你又完美示範了一次「第三人效果」。

Footnotes

  1. https://zh.wikipedia.org/zh-tw/%E7%A1%AB%E7%A3%BA%E5%B2%9B%E6%88%98%E5%BD%B9

Bear Blog 的教父 ʕ•ᴥ•ʔ

· 閱讀時間約 2 分鐘

Derek Sivers 的網站上看到他這樣推薦 Bear Blog

If you don't have a personal website yet, I highly recommend Bear at BearBlog.dev. It's so simple, clean, and free. The owner and creator, Herman in South Africa, runs it himself with great love. And no investors so no enshittification. He plans to keep it alive forever.

(如果你還沒有個人網站,我強烈推薦 Bear。它超簡單、超乾淨、而且免費1。創辦人 Herman 在南非獨自用愛經營,沒有投資人,沒有大便化。他說他計畫永遠經營下去。)

I believe in it so much that I told Herman I would be its godfather. If he ever can't (or doesn't want to) run it anymore, I will help run it, or fund a foundation to keep it alive.

(我對它的信心大到,直接跟 Herman 說我要當它的教父。如果他哪天無法或不想經營了,我會幫忙接手或出資成立基金會讓它活下去。)

──Derek Sivers

Derek Sivers 這樣的大咖出來背書,還直接霸氣地說「我會出手讓它活下去」,我想 Bear Blog 應該是很值得信任的(至少比起 Substack、痞客邦、Medium、WordPress.com 這些服務值得信任多了)。

而且它真的超級簡單。不需要懂任何技術問題,真的只要五分鐘,就可以讓你的個人網站上線了。

如果你還沒有個人網站,今天就是去弄一個的好時機?現在就去!然後來參加這個月的 BlogBlog 同樂會

Footnotes

  1. 要有完整功能和自訂網域還是需要付費的,但很便宜。

你的心理問題,可能是體力問題

· 閱讀時間約 2 分鐘

想像這樣的場景:你提著兩大袋超市買的重物,爬上四樓已經快虛脫了。剛進家門,伴侶只是隨口問了一句:「等下要吃什麼?」,你卻瞬間感到一陣無名火,當場臭臉回應。

你事後反省是不是自己脾氣差、情緒管理有問題。

但搞不好真正的原因是──你只是體力太爛。光是「爬完四樓之後還要動腦」,就超出身體的負荷了。

我們以為的心理問題,可能是體力問題。不覺得許多所謂「性格缺陷」的根源,都可以追溯到身體不夠好嗎?

  • 😶 以為自己內向,其實是因為洗澡、換衣服、出門、搭車、走路,抵達聚會現場就讓你沒電了,根本沒餘力跟人社交。
  • 🧳 以為自己不愛旅行,其實是想到要訂機票、飯店、整理行李、拖著行李箱走路就覺得煩了,哪有心情規劃什麼浪漫行程。
  • 🦶 以為自己討厭逛街,其實是才站二十分鐘腳底筋膜就開始痛,當然看什麼都覺得煩。
  • 🧠 以為自己專注力不足,其實是因為大腦總是在用 50% 的頻寬處理「脖子好痠、肩膀好緊、腰有點怪」的背景雜訊。

體力就像經濟能力一樣:月薪三萬的人跟月薪三十萬的人,面對一筆五千塊的帳單,感受完全不同。

幫忙搬個箱子、多走一個公車站的距離、排隊買杯飲料──這些對體能好的人來說都是「零錢」,但對體能差的人來說,每個都是可能導致破產的「鉅額開銷」。

長期處在「體力貧窮」的狀態,人就會開始「省著用」自己。變得吝於助人、懶得互動、抗拒嘗試新事物,日子當然就過得越來越窄。

開始運動,把人生切換回 Easy Mode 吧!拿著東西跑一段路不會喘、過馬路時綠燈只剩五秒也能輕盈通過、爬樓梯比旁邊用電扶梯的人還快──這些微小的方便累積起來,就是完全不同的生活品質。

溫柔耐心,都需要體能來支撐。你的 EQ 高低,可能只是取決於心肺功能好不好。

只是一些隨機的照片

· 閱讀時間約 2 分鐘

我一直以為我的衣櫥裡只有一種襪子。我錯了,其實有兩種!

(難怪常常穿起來兩隻腳感覺不一樣!我還以為我的腳有什麼問題咧。)


空間不夠了耶,那我們把右括號改成半形好了。

(它是英文,照理說左右括號都該半形才對──其實左括號才是錯的。)


Garmin 的錶竟然會為了十二年才出現一次的日子準備一張專屬圖片!

(馬年行大運!)


中山站附近,超級超級超級超級貴的優格冰淇淋!是滿好吃的,但沒有好吃到讓我覺得這價格合理。

(這杯的錢大約可以吃十支義美霜淇淋,而且義美的可能還更好吃。)


我已經做好心理準備要吃焗飯,結果它是布丁。

(不覺得長得很像焗飯嗎?)


常吃的雞胸肉換包裝了(左舊右新),新包裝吃起來感覺更健康了呢!

(舊版的淺藍色跟我小時候家裡馬桶的顏色一模一樣,這很可能是我覺得它比較不健康的原因。)


原來這裡是屈臣氏啊,我還以為是美術用品店呢!

(雖然化妝的確能夠把一個人「重畫」到完全認不出來。)


我迷上了無酒精啤酒,MOMO 上面的每一款我都想要訂訂看!喜歡啤酒味道但不想喝醉的人,強力推薦入坑!

(這款三得利的真的好喝,幾乎零熱量!)


路邊的空氣品質顯示器,一個只需要顯示幾個數字的機器,跑著 Windows 作業系統,然後記憶體不足當機。

(不知道有多少納稅人的錢,就這樣浪費在 Windows 授權費裡。)

最好的年紀

· 閱讀時間約 5 分鐘

聽到《沐後yeh在聊》Podcast 的其中一集,兩個主持人聊到「把握當下、好好活在人生最好的年紀」這個話題。她們說,現在就是她們「最好的年紀」(兩個主持人大概都在 25 歲上下)。

25 歲時覺得當下的年紀很好、要好好把握,這我完全可以理解。

但是啊,你說「最好的年紀」是幾歲?這還需要討論嗎,當然是 16 歲呀──你看《蘇菲的煉金工房 2》的蘇菲是 16 歲、《空之軌跡》的艾絲蒂爾是 16 歲、《搖曳露營△》中的志摩凜在第一季時是 16 歲、檸檬卷當然毋庸置疑地也是永遠的 16 歲。

在遊戲和二次元世界裡,16 歲就是冒險的開始,有並肩作戰的隊友、有心跳加速的初戀,還有無限的可能。

當然現實生活的 16 歲是沒有那麼美好的。如果回顧我自己活到目前為止(40 年)的經驗,對我而言最好的年紀是幾歲呢?如果可以挑選,我最想永遠停留在哪一個年紀呢?讓我來想想看:

  • 🍼 0-5 歲:根本沒記憶,不算。
  • 🤮 5-9 歲:有嚴重嘔吐症狀,超討厭幼稚園和學校,還會被老師體罰。糟透了。
  • 🎹 9-12 歲:小學三年級時考進音樂班,鋼琴老師超兇,壓力好大,想放棄鋼琴。
  • 🚌 12-15 歲:住在新北市土城,卻唸台北市東區的學校。每天在公車上花三小時,早上五點半出門,晚上七點才到家,累爆。
  • 🏫 15-18 歲:師大附中的生活是真的滿快樂,但升學壓力還是很大,生活自由度也還是有許多限制。
  • 🏔️ 18-24 歲:北藝大的黃金歲月,那裡空氣好、風景好、學到很多東西,還談了很不錯的戀愛,而且不用住家裡真是太好了。但是這時候很窮,對自己其實沒什麼自信。
  • 🪖 24-25 歲:當兵,糟透了。剛開始全職工作,累爆。
  • 🫥 25-31 歲:(@%$#⋯⋯記憶已x%!#損毀
  • 💸 31-32 歲:存款歸零,然後遇到檸檬卷
  • 🍖 32-38 歲:跟 YouTube 演算法搏鬥,用力賺錢,大吃大喝,體重攀升,身體壞掉。
  • 38-40 歲:開始運動、戒酒寫 blog;生活變閒;曾經卡關的人生和音樂專業問題,許多都想通了。

所以答案是:我的「最好的年紀」就是現在!不管是對生活的掌控權、累積的專業知識、戒酒後救回的心肺能力、內心的平靜程度,都是有史以來最好的狀態

希望五年後的自己,還是能說出「當下就是最好的年紀」。要達成這個目標,需要現在就好好照顧自己才行啊。