如果你是第一次到訪,或並未追看所有文章,可從這裏開始認識我及2020年之前的一些舊精選文章。
由2020年6月開始,新文章會先在 https://www.patreon.com/laxinvest 發表,此網誌只轉載部份文章,敬請留意。

2023年2月20日 星期一

人工智能體驗之旅:從文字、圖像至影片

  自ChatGPT去年11月面世後,轉眼熱爆全球,台灣地區可以自由登記使用,中港地區就需要通過VPN,我也很早就登記並試用了。AI這話題我其實想聊很久,但覺得如不經過一段時間的沉浸與ChatGPT溝通,得到確實的真正體驗,就只是紙上談兵而已,倒不如不聊。

  網上已出現無數關於ChatGPT的文章、應用和影片,我不去浪費時間介紹其原理及背景了。簡言之,ChatGPT可說是有史以來最強大的自然語言生成機器人,和以前的聊天機器人不同,它真的做到像人一樣理解你的問題並作出人性化的回答,很會聊,也很好聊。

不過,真的如新聞所說,ChatGPT很快將令Google搜尋龍頭地位告急嗎?我認為相比現時的Google搜尋引擎,兩者還是在不同的定位。


ChatGPT可取代Google嗎?

  在搜尋資訊方面,我認為不能。

  Google是一個全面的搜尋引擎,它可以搜索整個互聯網,並以多種方式對結果進行篩選和排序,以便找到最相關的資訊。相比之下,ChatGPT是一個基於語言的模型,它依賴於其訓練資料以回答問題,但它沒有能力去搜索整個互聯網並找到最相關的結果。ChatGPT可以作為一個資訊提示工具,回答問題和生成文本,但它不能取代Google的功能。

  大家有沒有覺察,以上一段話其實是由ChatGPT回答的,我甚至故意串錯Google,但ChatGPT也能明白我在問甚麼:



  現在讓我自己來回答:ChatGPT和Google在資訊提供方面,最大的分別是前者以需要以完整自然的語言來發問,後者則可以「模糊搜尋」。

  使用ChatGPT時,使用者搜尋的問題都是一句完整且自然的人類問題,這就像我們在現實中向老師提問,然後得到一段完整而針對問題的答案。這種方法的前題是,問者必須知道自己想問甚麼才行,而得到的答案,也就限於問題的範圍本身。

  但在使用Google的搜尋引擎時,我們並不是這樣互動的,我們會輸入一些關鍵字,例如「金庸 小說」,而不是「金庸寫過哪幾部武俠小說?」。Google出現的搜尋結果是一大堆排名最高的相關網站結果,與及一些網頁的文本摘要。

  相對於ChatGPT直接給出針對性的答案,Google還要使用者到處點選或跳轉網頁,花一堆時間自己整理出答案,在使用者體驗方面好像確實有所不如。但是,這是Google的短處同時也是長處,在大多數時候,我們往往是「不知道自己不知道甚麼」,自行尋找和整理答案的過程,才會令我們真正學習到知識。

在真正的學習中,懂得問問題其實已經代表你明白了一半,更多時候,我們是連怎樣問正確的問題都不知道,這時就需要搜尋引擎來引導。也就是說,ChatGPT只是單純針對資訊詢問和問答的工具,並不能取代搜尋引擎。

  同時,我們也無從判斷ChatGPT的答案是否正確,因為我們不知道其答案的源頭。ChatGPT的知識源頭也是來自互聯網上真假難辨的資訊(GPT-3版本的知識只截至2021年),缺乏源頭就讓我們就無法去做事實核查(Fact Check)。在我與ChatGPT的問答中,同一條問題有時甚至會出現相互矛盾的不同答案,感覺ChatGPT有時在「一本正經地胡說八道」。

  此外,ChatGPT的運行成本相當高,現時月活躍使用者約2,100萬人,運行ChatGPT的成本估計每天高達10萬美元,相當於每月300萬美元或每年3,600萬美元。而Google 搜尋引擎的月活躍人數在852億左右,是ChatGPT的4萬倍,粗略估算一下,如果我們一年3,600萬美金乘4萬倍使用者,是足足超過每年1.44兆美元的運行成本,這好像不可能以廣告收費回本(以ChatGPT的形式也難以賺取大額廣告費)。

隨著Google推出Brad、百度推出文心一言,聊天機器人的競爭進入白熱化, 但這是在以本傷人來搶佔市場,最後很可能難以維持長期免費而必須轉成收費形式。賺錢形式可能是頭幾十條問題免費,之後每條問題收費1或2美分,這就和Google的搜尋引擎形成很不同的商業模式。

不過,ChatGPT或所謂人工智能就僅止於此?絕對不是!

事實上,ChatGPT最擅長的並不是聊天或回答問題,而是「文本生成器」——幾乎所有你可以想像到的內容,它都可以幫你撰寫出來,包括翻譯、推廣文案、論文、信件、電郵、程式碼、說明書、小說、詩歌、散文、笑話……


文本生成器

  我第一次真正將ChatGPT應用在現實,是在與IB及Patreon的溝通上。我是一個很討厭寫投訴信件的人,所以我把自己的投訴和疑問以簡單的幾個要點(point form)形式丟給ChatGPT,讓它自動生成以下的信件:

(To IB)

Dear Sir or Madam,

I hope this email finds you well.  On December 9th, 2022, I attempted to trade a number of corporate bonds, including CUSIP 345370BV1, IBCID49888864, 370425RZ5, IBCID29107295, IBCID50542410, IBCID29203795, and USP78625DD22.  However, I was unable to do so as the bonds all displayed the message "No Opening Trades: The outstanding amount of the bond is less than 25% of the original issue amount".

I am writing to inquire about the reason for this issue and to request guidance on how I can enable trading for these bonds.  Previously, I was able to trade these bonds without any problems.

I would greatly appreciate any information you can provide on this matter.

Thank you for your attention and I look forward to your response.


(To Patreon)

Dear Sir or Madam,

I have been informed by some Patrons (e.g. XXX, XXX) that their recent payments have been rejected, despite the fact that they have consistently made successful monthly or yearly payments in the past.  Upon investigating, I discovered that all of their payments are listed as "Fraud" status.

As a result of this issue, I have lost many Patrons this month, most of whom were long-time supporters.  I would greatly appreciate it if you could please help resolve this issue.


  基本上我不需作任何修改,就原文Copy & Paste轉發給IB和Patreon,對方根本不會察覺這不是由真人寫的。很快我收到對方的回應,但我也不知道對方的回應是否也是由機器人自動生成。

  想像一下,如果再裝備現已成熟的語音引擎,客戶服務這行業,危矣!

  現在,我想寫一篇關於AI和ChatGPT的文章,以下是ChatGPT給出的大綱:



  我可以繼續叫ChatGPT依照大綱自己寫下去,例如命令它直接撰寫結論的中「AI和ChatGPT的價值」此一章節,字數限制在500字內:



  餘此類推,最後整篇探討AI和ChatGPT的學術文章,ChatGPT都可以獨立完成。照這勢頭再發展下去,日後我們還需要文字工作者嗎?

  所以,ChatGPT直接淘汰的不是Google,而是翻譯、客服人員、撰稿員、推廣文案撰寫者、程式編寫員、程式除錯者……然後可能是程式設計師、編劇、作家……

  當然,現時ChatGPT仍有相當的不足之處,例如我叫ChatGPT創作一則笑話,那笑話就一點也不好笑:



  當我們與ChatGPT溝通時,會發現它已經盡量模擬人類自然溝通,但仍明顯缺乏人性,例如幽默感。它的笑話並不是人類的梗,有時甚至不知道笑什麼。論到ChatGPT的寫作能力,我們不妨將它與一位小學生做比較。小學生的作文雖然還未成熟,但是卻充滿了無限的潛力,而ChatGPT的文筆卻是相當的欠奉,它寫的理論論述可以,但是文學創造遠遠達不到人類的水準。就像一個小學生不懂得如何寫一篇漂亮的情詩,ChatGPT同樣不懂得如何寫一篇有文采的文章。

  不過,讓我們來看看AI技術的未來。沒有人可以想像它未來的發展,但是我們可以確定的是,ChatGPT只是AI技術的一個開始,未來的技術一定會變得更加的強大。也許有一天,它的幽默感會變得像喜劇演員一樣,它的文筆會變得像文豪一樣。也許有一天,它可以成為一個真正的藝術家,而不僅僅是一個文字生成器。

  對不起,我偷懶了,以上兩段文字是由ChatGPT生成的。

哦,對了,這篇文章的標題也是ChatGPT建議的。


圖像生成器

  AI的發展只限於文字嗎?當然不是,插畫家、藝術工作者或設計師的飯碗,可能更早受到影響。

  早在ChatGPT正式面世前,其開發公司OpenAI已開發出AI數碼圖像生成器「DALL.E,現已是第2個版本。簡單說,AI數碼圖像生成器,就是由使用者輸入一些文字的描述,再由人工智能自動創建圖像、照片或藝術畫。

  登記成為OpenAI的會員在第一個月可免費得到40多點Credits,之後每月可得到10幾點免費Credits,每點Credits可創造一組四幅圖像,Credits不夠可再另行付費購買。

  我將「三更窮、五更富」這六個字翻譯成英文,再輸入DALL.E,以下是其創建出的四幅圖片:



  個人感覺,DALL.E的圖像品味不大對我胃口,轉而去嘗試另一款更著名的AI數碼圖像生成器——Midjourney,其AI作品甚至曾在藝術比賽中拿下冠軍!

  Midjourney是通過Discord公開頻道使用,使用方法較為繁複,因為頻道內的訊息會一直被洗版,更新很快。



  但是,Midjourney的成像質素真的相當不俗,例如當我輸入「日漫風格的AI世界」時,Midjourney創建的四幅圖像如下:



  可能是輸入的形容詞太抽象,個人感覺圖像的展現好像不大對題。那就具體一點,我索性將《神雕俠侶》中關於小龍女的形象以Google翻譯成英文:



  然後再將這串英文之給Midjourney,看看依照小說內描述的小龍女形象,人工智能將如何繪製。結果如下:



  嗯……我覺得第三張圖片較漂亮,就按下「V3」指使Midjourney稍加變化,最後成為Midjourney版小龍女:



  上圖也許和我們想像中的小龍女形象還是有一點出入,但相信我,以西方人看東方人的眼光來說,Midjourney算是做得很不錯了,以同樣文字創建的DALL.E版小龍女,簡直就是不堪入目,我不想擺出來污染螢幕。

  除了DALL.E和Midjourney外,好用的AI繪圖程式還有Stable Diffusion、文生圖兩款,各有不同特色,大家有興趣都可以去試用看看。試用完後大家可能和我有相同感覺,這些AI圖像生成器絕對會大大地撼動原本的藝術與設計產業生態。


影片生成器

  人工智能既然可以自行創作文字、自行繪圖,自然也可以自行拍片。

  影片生成器,就是由使用者輸入一些文字的描述,再由人工智能自動產生一段影片,直接幫你配圖、配動畫、剪輯、配音、上字幕……

  目前影片生成器有Meta的Make-A-Video與Google的Imagen Video,都是將文字轉化為影片的AI系統,但兩者都還在開發階段,尚未向公眾開放使用。另外有一些較小型公司開發的AI影片生成器,大多都未成熟或以英文為輸入基準。

  以中文輸入並可以理解中文的免費影片生成器,暫時只有……(軟體和使用方法僅限Patreon全文)。程式會根據文字自動智慧匹配各種圖片素材、動畫、字幕、旁白和音樂,自動生成影片,其智慧朗讀的旁白幾乎貼近真人朗讀效果。

  以下是由AI製作的兩段影片:

  https://youtu.be/zJJQiuu8RD8  

  https://youtu.be/kFCTiosyA1g 

  影片99%是由AI自動生成的,我只是提供了文字及替換了其中一些圖片,大家可以察覺得到這是人工智能生成的影片嗎?


總結

  以上是我初嘗人工智能的體驗,本來想分成兩篇寫的,最後還是一氣呵成寫下整篇文。但寫了五千字還是只屬非常初步的探討,主要探究以人工智能一條龍創作文字、圖像以至影片的可能性。如果我再進一步,利用ChatGPT的API去連結其他介面或程式(例如Line這種交談軟件),發揮更是無窮無盡。

  每當新的技術或概念出現,可能只屬於潮流、泡沫,也可能是在真正意義上改變人們生活的重大革新。虛擬貨幣,我覺得只是潮流;元宇宙和NTF,由頭到尾就是泡沫;電動車,我覺得只是汽車工業上的改進;唯有ChatGPT這類人工智能的面世,我是一點也不敢小看,最新的工業革命很可能就在此時正式啟動。

  每次工業革命都淘汰一大批舊行業,現在的ChatGPT應用範圍已包括了資訊提供、客服應答、智能助理、聊天夥伴、文章撰寫、文字撮寫、故事創作、程式編寫、翻譯、文法修改、詩詞創作……請注意,現時ChatGPT只是一個通才,訓練的是一般知識,想像一下,如果將ChatGPT複製在各專業領域,喂入專業的知識,令其成為各領域專才,又將取代多少專業職務?(醫生?法官?工程師?……)

  在以前,我們可能還會覺得AI取代的主要是機械性、重複性或細緻性的工作,那些人性化的創作,例如藝術、文筆、才藝、創意、情感這些東西暫時仍是不可取代的。可是,隨著圖像和影片生成器的面世,人工智能再結合語音、圖像與動畫,我們可能會發現不斷發展的AI,可以比人類更有創意、更有温度,在不久的將來,也許會出現比人類更出色、更人性化的AI作家、AI演員、AI導演、AI畫家、AI行為藝術家、AI設計師、AI老師……

  在AI未發展出自我意識前,我們還可以辯稱那只是模擬出來的人性,但當模擬人性令我們自己都分不出真假時,真假還重要嗎?人類所謂的創造力,只有極少數是憑空冒出來的,絕大多數的創造力都是某程度的跨領域融合後的結果,而這恰恰就是AI最擅長的。AI也並不需要真的有感情,他們只需要掌握了人類會對於哪樣的設計會有怎樣的反應的公式,他們就能夠創作出「具備情感」的作品。

  很多人會擔心人工智能將反過來控制人類,但我覺得更應該擔心的,是繼「數碼鴻溝」之後的「AI鴻溝」。

有人以為,當AI能取代大部份人類工作時,AI的生產力就足以供給全球80億人口的生活,屆時人類可以不事生產、專責享受——進入真正的人間天堂。

不,人類歷史從來不是這樣發展的,沒有生產力的人從來不可能坐享其成,只會被時代淘汰,包括那些不能跨越「AI鴻溝」的人。

在人類的歷史上,新科技的發明雖然消滅了舊工作,但同時也產生了許多新的工作,但那是因為以前的科技發明都是融合人類的生產力流程的工具,並不具備完全取代人類的潛力。AI的發展卻完全不是這回事,AI科技的最終目標就是完全取代人類智能的萬能科技,未來二十年,可能將有大量我們曾經認為不可能被 AI 取代的工作,全面性的被 AI 取代,從而導致人類社會全面的大失業潮。

過往科技革新的歷史經驗,在這一次很可能不再適用。如果有那一天,整個社會九成以上的價值生產活動被AI完全取代時,最可能發生的是,世界被懂得訓練、掌控、融入並利用AI強化自身的10%高等人類掌控,其餘90%的人類,不會被容忍,勢將被陰乾、淘汰、滅亡!

今天,你是準備成為那10%的菁英族群,還是另外90%將被淘汰的人類?由現在至AI全面取代人類,可能只有二十年時間,這二十年是人類與 AI 高度協作的過渡期時代,好好掌握,或許能讓你在進入下個時代前,佔據一個較優勢的位置。 

(節錄自Patreon文章)


******************************************************

  歡迎同道中人加入我的Patreon,閱讀所有會員文章,一齊討論、一齊交流、一齊進步。

Patreon:
https://www.patreon.com/laxinvest  

Facebook:
https://www.facebook.com/chaseinwind/  

Blogspot:
https://laxinvest.blogspot.com/