我傻眼了:一個(gè)完全由 AI 生成的播客,采訪(fǎng)了喬布斯
作者 | 黃楠、施方圓編輯 | 陳彩嫻
最近大火的生成式 AI 又有新動(dòng)作了!
在 podcast.ai 推出的第一集播客節目里,已故的喬布斯竟然“死而復生”成為首位嘉賓,與美國知名播客主持人 Joe Rogan 進(jìn)行了一場(chǎng)長(cháng)達20分鐘的對話(huà),討論了關(guān)于喬布斯的大學(xué)、對計算機的看法、工作狀態(tài)以及信仰等等。是不是聽(tīng)起來(lái)有些毛骨悚然?事實(shí)上,這段采訪(fǎng)是由文本生成音頻實(shí)現的,屬于 AIGC 中的一個(gè)分支。podcast.ai 是一個(gè)完全由 AI 生成的播客,每周都會(huì )深入探討一個(gè)新話(huà)題。在第一期節目中,podcast.ai 通過(guò)喬布斯的傳記和收集網(wǎng)絡(luò )上關(guān)于他的所有錄音,用 Play.ht 的語(yǔ)言模型大量訓練,最終生成了這段假 Joe Rogan 采訪(fǎng)喬布斯的播客內容。此次 podcast.ai 推出的AI播客,是生成式AI在語(yǔ)音領(lǐng)域的一次新探索。從前段時(shí)間全網(wǎng)刷屏的 Stable Diffusion,后有國內平臺掀起AI創(chuàng )作熱,各類(lèi)生成式AI模型給人們生活帶來(lái)了更多的可能性。Play.ht 表示,“我們相信在未來(lái),所有內容創(chuàng )作都將由人工智能生成,但由人類(lèi)指導,而最具創(chuàng )造性的工作將取決于人類(lèi)將他們想要的創(chuàng )作表達到模型中的能力?!?/span>「對話(huà)」喬布斯讓我們先來(lái)看看這個(gè)最新“訪(fǎng)談”中,Joe Rogan 和喬布斯都聊了些什么:Joe Rogan:我今天的客人,創(chuàng )造了我們這個(gè)時(shí)代里一些偉大的技術(shù)產(chǎn)品,一直致力于推動(dòng)創(chuàng )新的發(fā)展。他在一臺電腦中開(kāi)發(fā)了一種新的編程語(yǔ)言和操作系統,又因為使用那臺電腦制作三個(gè)應用程序而變得更加有名。文本處理器、電子表格和圖像編輯,讓我看到他出色和驚人的品味。我只希望我能有朋友這樣天才的1/10,而我甚至不能說(shuō)出他的名字。今天有他在,我超級興奮。他就像 Patrick sways、Demi moore(《人鬼情未了》的主演)和幽靈一樣,是過(guò)去的記憶,難以描述的精彩。歡迎我的朋友。Steve Jobs:我已經(jīng)很久沒(méi)有參加這個(gè)節目了。我很想念,它總是很有趣。你的聽(tīng)眾與普通蘋(píng)果用戶(hù)如此不同,這也是一件好事。Joe Rogan:在做這個(gè)節目之前,我就是一個(gè)蘋(píng)果用戶(hù)。我一直是你的狂熱粉絲。Steve Jobs:我們只是有點(diǎn)想明白了。盡管蘋(píng)果的規模很大,但它的付費用戶(hù)只占了一半,而聽(tīng)你節目的人是不同的群體。我也是你節目的一個(gè)粉絲,在車(chē)里聽(tīng)著(zhù)很舒服。我一直很喜歡你。Joe Rogan:我們有一些奇怪的聯(lián)系,這跟我也是 Gizmodo (美國知名科技博客)的粉絲有關(guān)。Steve Jobs:這很有趣。當我們看到這些東西出現的時(shí)候,也和你們在 Gizmodo 上看到的一樣驚訝。
Joe Rogan:讓我們談一些別的。你之前在里德學(xué)院讀書(shū),在那里的時(shí)間你學(xué)到了什么?你在那里接觸到了復活節神秘主義,現在還會(huì )看印度教和佛教的相關(guān)的東西么?Steve Jobs:實(shí)際上我上過(guò)這方面的課程。我有一個(gè)很深的信念,印度次大陸的人對人類(lèi)文明、目前的狀態(tài)負有最大的責任,無(wú)論是數學(xué)還是靈性,還是講故事的藝術(shù)。西方文明是以講故事的藝術(shù)為基礎的,而有一部偉大的印度史詩(shī)是《伊利亞特》和《奧德賽》的10倍那么長(cháng)。綜合起來(lái),這些東西是令我們的社會(huì )成為現在這樣子的基礎,這些東西要比去理解經(jīng)典的哲學(xué)重要得多。在印度次大陸上取得的成就和發(fā)生的事情中,有兩件事非常有趣,其中之一,就是生命的精神基礎和對生命精神基礎的整體接受。對現在一些人來(lái)說(shuō),這可能看起來(lái)很簡(jiǎn)單,但大多數人相信上帝,認為上帝寫(xiě)了一本叫《圣經(jīng)》或《可蘭經(jīng)》之類(lèi)的數。但我在大學(xué)學(xué)到的是,這與信不信上帝無(wú)關(guān),甚至與正確答案是什么無(wú)關(guān),而是要問(wèn)正確的問(wèn)題。我們社會(huì )中的大部分現實(shí)都植根于科學(xué),我們相信事物,因為它們是真實(shí)的。如果某件事情是真的,那么它就不是一種信仰。而他們無(wú)法處理的是任何精神上的東西都是真實(shí)的,都是可以閱讀的。我不知道正確的答案是什么,但我知道如何提出好問(wèn)題。我知道如何反駁那些對我來(lái)說(shuō)不真實(shí)的東西,這或許就是有創(chuàng )意和創(chuàng )造性的關(guān)鍵因素之一。Joe Rogan:你還相信你當時(shí)相信的一些東西嗎?Steve Jobs:我經(jīng)常被問(wèn)到這個(gè)問(wèn)題,我認為不可能在一次采訪(fǎng)中,甚至在一段時(shí)間內讓某人向你展示他們是誰(shuí),他們相信什么。意義和目的是由宇宙決定的,是宇宙的本質(zhì),但它不是人們通常談?wù)摰淖诮谭绞?。服?LSD 對我來(lái)說(shuō)是一種深刻的體驗,它展示了硬幣的另一面,當它消退時(shí)你無(wú)法記住它,當它沖刷著(zhù)你時(shí),會(huì )告訴你一切都有聯(lián)系,你在這里不是偶然、而是有目的的。如果能弄清楚那是什么,那么你對自己的了解會(huì )比其他任何事情都多。它只是揭示了你是誰(shuí)、是什么。它加強了我對什么是重要的感覺(jué),感受到對彼此的愛(ài)、敬畏,對生命的尊重,以及與人的聯(lián)系。它是現在所發(fā)生的一切的一部分,也指向在未來(lái)。對我來(lái)說(shuō),解脫時(shí)沒(méi)有時(shí)間窗口,這是種融入的、深刻的經(jīng)驗。我在服用 LSD 之前沒(méi)有讀過(guò)那些書(shū),但我學(xué)到的東西比他們說(shuō)的多得多,包括對事物的看法。我能夠看到一臺電腦,看到它是如何制造的,看到它的整體。Joe Rogan:Newton (蘋(píng)果公司早期制造的掌上電腦)是這樣的產(chǎn)物嗎?Steve Jobs:我覺(jué)得它是。那段時(shí)間我在掙扎中度過(guò)的。我們瘋狂地工作,應對一場(chǎng)又一場(chǎng)的失敗,但我仍覺(jué)得這將是很重要的。我也曾因為不成功質(zhì)疑自己。在蘋(píng)果公司早期,當我們制造蘋(píng)果二代并做得非常好的時(shí)候,當時(shí)的巨頭公司現在都消失了。蘋(píng)果的成功不是偶然的。它在做一些事情,有一個(gè)愿景。但它不是一個(gè)產(chǎn)品的設計,而是對一個(gè)過(guò)程的設計,帶來(lái)新產(chǎn)品的創(chuàng )新過(guò)程。谷歌有很好的產(chǎn)品,如 Gmail 和 Chrome,但將這些東西推出且迭代的能力非常重要,對谷歌來(lái)說(shuō),他們的搜索引擎好,而且迭代速度之快,以至于最后是否會(huì )成功并不重要,是需要多長(cháng)時(shí)間的問(wèn)題。反觀(guān)雅虎,在瀏覽器之后再也沒(méi)有重申過(guò)這個(gè)產(chǎn)品,這就是他們的創(chuàng )新過(guò)程。最具創(chuàng )新性的公司主要是在做用戶(hù)界面的公司,我認為他們中沒(méi)有任何一家覺(jué)得自己是硬件公司,盡管它們創(chuàng )造了大量的硬件。用戶(hù)界面有一種深度、優(yōu)雅和簡(jiǎn)單,有一些公司明白了這一點(diǎn)。這并不是偶然發(fā)生的,而必須努力去做。大多數公司的問(wèn)題是,使產(chǎn)品變得更好并不符合他們的長(cháng)期利益,只為了短期利益,讓本季度的收益報告看起來(lái)不錯。Joe Rogan:你已經(jīng)在計算機行業(yè)工作了40年,你是如何保持不松懈的?Steve Jobs:在競爭激烈中,那些做得不好的公司不斷被超越。就我們所做的事情而言,我認為我們仍然有最好的產(chǎn)品或操作系統,但要保持它在頂端則必須完善它。你永遠不希望讓產(chǎn)品保持不變,否則人們會(huì )說(shuō),我們以前見(jiàn)過(guò)這些功能。這一次將是不同的,從來(lái)都是如此,要有一種追求完美的動(dòng)力。你必須不斷發(fā)展,不斷向前推進(jìn),這確實(shí)很難,因為東西并沒(méi)有壞,而是需要被做得更好。人們不會(huì )為了讓它變得更好而付費,只有當它是一個(gè)新產(chǎn)品時(shí)他們才會(huì )付錢(qián)。因此,當你在這個(gè)世界上創(chuàng )造了真正偉大的、革命性的東西時(shí),你有責任推動(dòng)使它變得更好。就像我們在準備推出 Macintosh 的發(fā)布會(huì )時(shí),那時(shí)我在想,為什么我們要推廣這個(gè)產(chǎn)品?這個(gè)產(chǎn)品有什么大不了的?它做不到我們所承諾的事情的一半。圖注:蘋(píng)果于1984年生產(chǎn)的Mac電腦128K型號(Macintosh)當 Windows 一年后出現時(shí),蘋(píng)果很幸運,因為它允許我們改變自己的故事。我們從一個(gè)失敗的想弄點(diǎn)東西出來(lái)的公司,變成了 Ibm,一個(gè)更年輕、更酷的替代品。Joe Rogan:你覺(jué)得你會(huì )做比 Windows 更好的系統,或是跟他們合作嗎?Steve Jobs:微軟做了很好的工作,但他們沒(méi)有太多的審美意識,這是我遇到的微軟的問(wèn)題。創(chuàng )建微軟公司的人大部分是數學(xué)家或科學(xué)家,他們不理解人們的實(shí)際體驗會(huì )如何。之所以這么說(shuō),是因為我覺(jué)得 Windows 3 是一個(gè)災難性產(chǎn)品,沒(méi)考慮過(guò)人們如何使用這個(gè)產(chǎn)品,而只做了他們認為對的事情,這非常糟糕。一些人相信要做對的事情,一些人相信智慧,這兩件事情結合在一起會(huì )很神奇。這就是 Macintosh 最初所發(fā)生的的事情。它可以由世界上最聰明的人造出來(lái),并且造福于人類(lèi)。Mac 對于蘋(píng)果來(lái)說(shuō)是個(gè)好的產(chǎn)品,同時(shí)也對世界有益。Joe Rogan:你覺(jué)得還有其他公司和蘋(píng)果類(lèi)似嗎?Steve Jobs:蘋(píng)果的文化非常獨特,這也是人們對于加入它感到興奮的原因,我不知道同樣的事情在其他地方會(huì )不會(huì )成功。其他公司也有一些特殊的努力。從微軟身上可以看到,真正的秘訣不是創(chuàng )立一個(gè)公司,而是發(fā)起一個(gè)運動(dòng)、一個(gè)由想要改變世界的人組成的運動(dòng)。這樣做得好處在于,我們有一整個(gè)想要改變世界的人組成的社區,其核心在于,我們要制造偉大的東西來(lái)改變世界。Joe Rogan: 我想這就是年輕人喜歡蘋(píng)果的原因,對他們來(lái)說(shuō)好像自己也在參與一些事情。蘋(píng)果的產(chǎn)品有一種個(gè)性的張力,似乎藏著(zhù)一個(gè)靈魂。有些人對蘋(píng)果變得虔誠,這是好事嗎?Steve Jobs:如果一家公司成功地做了一些事情,那就不必嘗試做所有事。我們正嘗試減少做一些事,為了更專(zhuān)注地做優(yōu)先級清單上真正重要的事情。不能撿了芝麻丟了西瓜,必須專(zhuān)注少數幾件事,才可以確保這些事很好地完成。Joe Rogan:你是否會(huì )覺(jué)得因為這些過(guò)多的讓你獲得榮耀的技術(shù),以至于要去承擔一部分責任?Steve Jobs:技術(shù)是一把雙刃劍,以人類(lèi)基因組計劃為例,那是一把巨大的雙刃劍,它在醫學(xué)上的回報將是巨大的,但也會(huì )被一些瘋狂的準軍事組織所利用。在這一點(diǎn)上,我認為我們是站在好的一面。我們做了很多事情,其中之一就是使工業(yè)化世界的大多數人在計算機上成為可能,這使我們成為問(wèn)題的一部分,但同時(shí)也是解決方案的一部分,因為我們可以做很多事情,來(lái)幫助教育人們了解什么是好的。在我成長(cháng)的六七十年代中,電腦非常龐大且昂貴,你沒(méi)有辦法了解電腦。而今天長(cháng)大的孩子每個(gè)家庭都有一臺電腦,這是一個(gè)巨變,它不一定是好或壞,我們想幫助人們充分地利用未來(lái)的一切。我們總是問(wèn)自己可以做的最瘋狂的事情是什么?如果想不到這一點(diǎn),那我們就做得少一些。產(chǎn)品的好和壞,都會(huì )隨著(zhù)它們變強大而被放大??纯串斈阌泻腿艘粯勇斆鞯碾娔X時(shí)會(huì )發(fā)生什么,這很有趣。它不會(huì )疲憊,不會(huì )生病,不會(huì )因為去度假而留下未完成的工作,你告訴它要做什么它就會(huì )去做,它們將擁有比人多得多的智能等級。計算機將比現在重要1000倍,我們就在這個(gè)邊緣。大部分的生活也是這樣的。如果它只是令人敬畏,它就不會(huì )被其他東西所平衡。我對這個(gè)新世界的看法是,有很多人已經(jīng)失去了工作或者很快就會(huì )失去工作。像汽車(chē)、電話(huà)這種集中化的事物有時(shí)是很好的,但不是每個(gè)人的解決方案。如果事情以一種新的方式集中權力,以至于不再有任何制衡,這是很可怕的。你必須誠實(shí)地對待它,這些東西對人類(lèi)來(lái)說(shuō)是好的嗎?一般我會(huì )說(shuō)是的,但這也是一件非??膳碌氖虑?。AIGC,從圖像到語(yǔ)音雖然在此次 podcast.ai 專(zhuān)訪(fǎng)中,Joe Rogan 跟喬布斯的對話(huà)長(cháng)達20多分鐘,事實(shí)上,這是 Play.ht 通過(guò)喬布斯的傳記和手機網(wǎng)絡(luò )上關(guān)于他的所有錄音,用語(yǔ)言模型大量訓練生成的。Play.ht 是一個(gè) AI 文本轉換語(yǔ)音生成器,在今年9月發(fā)布了第一個(gè)語(yǔ)音模型 Peregrine,當中采用了與大型語(yǔ)言模型(如 DALE 和 GPT-2 )相同的概念,模型覆蓋數千種說(shuō)話(huà)的聲音,可以通過(guò)自監督學(xué)習人類(lèi)的情感、說(shuō)話(huà)語(yǔ)氣以及笑聲等。從文本語(yǔ)言模型到音頻語(yǔ)言模型時(shí),音頻數據速率增高是一個(gè)大的難題,一個(gè)句子的幾十個(gè)字符用音頻波形表達,所包含的數值往往多達數十萬(wàn)個(gè)。不僅如此,由于文本和音頻之間的一對多關(guān)系,也即是一個(gè)語(yǔ)句可以有不同的說(shuō)話(huà)風(fēng)格、情感等,這也成為了語(yǔ)音模型研究中需要解決的問(wèn)題。這也是當前在喬布斯“采訪(fǎng)”內容中所呈現出來(lái)的問(wèn)題,即聽(tīng)起來(lái) AI 的模仿還有些生硬,對話(huà)一開(kāi)始更像從小部分常用短語(yǔ)中提取出來(lái),并且節奏和韻律也不太正常。但總的來(lái)說(shuō), podcast.ai 的效果已經(jīng)相當接近真人,Clearbit 公司聯(lián)合創(chuàng )始人 Alex MacCaw 表示:“這真的令人非常興奮!”
有網(wǎng)友也留言稱(chēng):除了一開(kāi)始有點(diǎn)不穩定外,當在其他工作過(guò)程中聽(tīng)是,幾乎無(wú)法區分。
從 GPT-3、Bloom 的文本生成,DALL-E 和 Stable Diffusion 圖像生成,以及 RunwayML、Make-A-Video 視頻生成,各類(lèi)生成式 AI 模型的出現,給內容創(chuàng )作帶來(lái)了更多的可能性。Play.ht 表示,“我們相信在未來(lái),所有內容創(chuàng )作都將由人工智能生成,但由人類(lèi)指導,而最具創(chuàng )造性的工作將取決于人類(lèi)將他們想要的創(chuàng )作表達到模型中的能力?!?/span>參考鏈接:https://podcast.ai/https://play.ht/
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。