<address id="ltppr"></address>

      <sub id="ltppr"><listing id="ltppr"></listing></sub>
      <noframes id="ltppr">
        <noframes id="ltppr">

          <form id="ltppr"><nobr id="ltppr"><progress id="ltppr"></progress></nobr></form><address id="ltppr"></address>

          <address id="ltppr"></address>
          <noframes id="ltppr"><form id="ltppr"></form>
          <address id="ltppr"></address>

          只需3秒學習就能克隆別人聲音 微軟VALL-E AI模型惹爭議

          極客網·人工智能1月12日 訓練文本到語音模型通常需要更多或更長的樣本,但微軟開發的VALL-E可以從三秒鐘的音頻剪輯中克隆出任何人的聲音。網絡安全專家表示,如果沒有適當的限制措施,它可能被用于網絡釣魚攻擊或傳播錯誤信息。

          image001.png除了減少生成新聲音的訓練時間之外,VALL-E通過保留原始樣本的語調、魅力和風格,創造出比其他模型更自然的合成聲音。在編寫文本轉語音腳本時,可以根據需要對這些參數進行調整。 

          擁有這些功能意味著,只要從某人的電話、會談甚至播客中錄下三秒鐘的聲音,該模型就可以將其聲音合成為任何語音,例如可能會讓政客、演員甚至家庭成員說出轉帳或付款的話語。 

          微軟表示,與之前的合成語音模型相比,VALL-E的性能有所提高,以至于人們很難分辨聲音的真假。 

          就像用于訓練DALL-E2和GPT-3的大型生成式人工智能模型一樣,開發人員向人工智能系統中輸入了大量的音頻材料進行訓練。在訓練模型時,他們使用了長達6萬小時的演講錄音,其中大部分來自使用視頻會議Teams應用程序錄制的錄音。 

          VALL-E的使用場景 

          微軟目前還沒有對外開放VALL-E的代碼,只是發布了使用該工具生成的示例音頻文件。目前還不清楚微軟何時或是否計劃將VALL-E作為公共訪問或商業工具提供。 

          人工智能開發商Tovie.AI首席執行官Joshua Kaiser表示,該模型的設計方式允許用戶采用更少的數據做更多的事情,這對于那些試圖創建語音合成的開發商來說至關重要,因為這些公司沒有足夠的數據來提高性能。他說:“我們認為,這將使許多行業受益,例如零售業、金融科技業以及游戲行業,這些行業已經開始采用語音界面,使整個過程更容易訪問?!?/p>

          Gartner副總裁兼分析師Arun Chandrasekaran表示,VALL-E最大的好處在于其潛在的規模。它可以在“零樣本”或“少樣本”場景中有效,在這些場景中,很少有特定領域的訓練數據可用。他說:“此外,如果這些模型可以作為云計算服務交付,與傳統方法相比,它們可以減少建立和運行模型所需的時間和精力?!?nbsp;

          Chandrasekaran解釋稱,這項技術在現實世界中有幾個用例,包括語音編輯(可以糾正某個單詞或句子),不同場景下的語音背景化,交互式虛擬學習,以及客戶服務自動化。 

          VALL-E的使用確實存在風險,包括欺騙語音識別或模仿特定的演講者和名人,這可能會導致錯誤信息的快速傳播。這可能是微軟遲遲不發布該技術背后的代碼或發布API的原因,就像OpenAI和其他公司對GPT-3和DALL-E2等文本和圖像生成工具所做的那樣。這將使采用真實聲音進行網絡釣魚攻擊,或通過YouTube視頻或播客在網上傳播假新聞變得更容易。

          VALL-E的欺詐風險 

          網絡欺詐可能包括允許網絡犯罪者訪問使用聲紋作為密碼的銀行或安全系統,盡管其中許多系統都有檢測實時聲音還是錄音聲音的機制。它也可以用于網絡釣魚騙局,從電話中提取簡短的語音樣本,然后使用該樣本創建一個新的語音模型,可以更容易地說服某人透露密碼,也可能欺騙一些公司的財務經理。 

          互聯網安全解決方案供應商Check Point Software安全工程師Muhammad Yahya Patel表示,VALL-E等技術的進步不應該令人擔憂,但仍應謹慎對待此類系統。他說,“盡管VALL-E有其顯著的優點,但隨著它越來越成熟并融入我們的日常生活,微軟新的VALL-E文本到語音模型可能會對網絡安全產生一些令人擔憂的影響。如果說我們從去年吸取了什么教訓的話,那就是網絡犯罪分子會利用任何途徑誘騙毫無戒心的受害者,讓他們透露重要的密碼或財務信息。詐騙電話是威脅行為者常用的一種方法,考慮到這些活動的成功率,這種擔憂是有充分理由的?!?nbsp;

          他表示,這項新技術可能會給網絡犯罪分子提供升級技術的機會,并引入個人元素,包括允許他們模仿受害者熟悉的人員的聲音?!斑@將使任何人都很難區分他們信任的人的請求和網絡罪犯分子的請求。同樣,隨著我們走向銀行現在都在使用語音認證來授權交易的時代,很容易看到網絡犯罪分子以個人為目標獲得帳戶的訪問權限。關鍵是要理解黑客利用新技術的機會,并因此采取必要的預防措施?!?nbsp;

          行業媒體已經聯系微軟就其如何減輕VALL-E的潛在濫用發表評論,但未予置評。

          (免責聲明:本網站內容主要來自原創、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
          任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

          承受不住他的巨大尺寸

          <address id="ltppr"></address>

              <sub id="ltppr"><listing id="ltppr"></listing></sub>
              <noframes id="ltppr">
                <noframes id="ltppr">

                  <form id="ltppr"><nobr id="ltppr"><progress id="ltppr"></progress></nobr></form><address id="ltppr"></address>

                  <address id="ltppr"></address>
                  <noframes id="ltppr"><form id="ltppr"></form>
                  <address id="ltppr"></address>