機器學(xué)習vs.人工智能:定義和重要性
·營(yíng)銷(xiāo)和銷(xiāo)售——根據以前的購買(mǎi)推薦產(chǎn)品和服務(wù)的網(wǎng)站使用機器學(xué)習來(lái)分析購買(mǎi)歷史,并推廣客戶(hù)可能感興趣的其他項目。這種捕獲數據、分析數據并使用它來(lái)定制購物體驗的能力或實(shí)施營(yíng)銷(xiāo)活動(dòng)是零售業(yè)的未來(lái)。
本文引用地址:http://dyxdggzs.com/article/201902/398017.htm·運輸——分析數據以識別模式和趨勢對于運輸行業(yè)至關(guān)重要,這取決于開(kāi)發(fā)更有效的路線(xiàn),并預測潛在問(wèn)題以提高可靠性和盈利能力。機器學(xué)習數據建模和分析方面是運輸廠(chǎng)商、公共交通和業(yè)內其他組織的重要工具。
·石油和天然氣——機器學(xué)習有助于發(fā)現新的能源,分析土壤中的礦物質(zhì),預測煉油廠(chǎng)傳感器的故障,加速石油的分配,使其更加高效和經(jīng)濟。在這個(gè)行業(yè)中,機器學(xué)習應用程序的數量是巨大的,并且持續增長(cháng)。
·醫療保健 - 由于可穿戴設備和傳感器的出現,使醫療保健專(zhuān)業(yè)人員能夠實(shí)時(shí)訪(fǎng)問(wèn)患者數據,因此機器學(xué)習是醫療保健領(lǐng)域不斷發(fā)展的趨勢。該技術(shù)還可以幫助醫學(xué)專(zhuān)家分析數據,以識別趨勢或警報,從而改善診斷和治療。
機器學(xué)習中使用的方法
兩種最廣泛采用的機器學(xué)習方法是監督學(xué)習和無(wú)監督學(xué)習,但它們并不是唯一的方法。
通過(guò)標記示例訓練監督學(xué)習算法,作為已知所需輸出的輸入。例如,設備可能具有標記為“F”(失敗)或“E”(執行)的數據點(diǎn)。學(xué)習算法接收一組輸入以及相應的正確輸出,并通過(guò)將實(shí)際輸出與正確輸出進(jìn)行比較來(lái)學(xué)習以發(fā)現錯誤。然后它修改結算模型。通過(guò)分類(lèi)、回歸和梯度增強等方法,監督學(xué)習使用標準來(lái)預測附加的非標記數據中的標簽值。監督學(xué)習通常用于歷史數據預測可能的未來(lái)事件的應用中。例如,它可以預測信用卡交易何時(shí)可能是欺詐性的,或者哪些投保人傾向于要求其政策。
非監督學(xué)習用于針對沒(méi)有歷史標簽的數據?!罢_答案”未向系統報告。算法必須找出所顯示的內容。目標是探索數據并在其中找到一些結構。無(wú)監督學(xué)習適用于交易數據。例如,它可以識別具有相似屬性的客戶(hù)群,然后可以在營(yíng)銷(xiāo)活動(dòng)中對其進(jìn)行類(lèi)似處理;或者它可以找到分隔不同客戶(hù)群的關(guān)鍵屬性。常用的技術(shù)包括自組織映射、鄰近映射、k-均值分組和分解為奇異值。這些算法還用于分割文本主題、推薦項目和識別數據中的差異點(diǎn)。
半監督學(xué)習用于與監督學(xué)習相同的應用程序,但處理有標簽和無(wú)標簽的數據進(jìn)行培訓——通常是用大量無(wú)標簽數據標記的少量數據(因為沒(méi)有標簽的數據更便宜,并且需要花費更少的精力來(lái)獲取)。這類(lèi)學(xué)習可用于分類(lèi)、回歸和預測等方法。當與標簽相關(guān)的成本太高而無(wú)法實(shí)現完全標記的培訓過(guò)程時(shí),半監督學(xué)習非常有用。其典型例子包括在網(wǎng)絡(luò )攝像頭上識別人臉。
強化學(xué)習通常用于機器人、游戲和導航。有了它,算法通過(guò)嘗試和錯誤發(fā)現,哪些行為會(huì )帶來(lái)更大的回報。這種類(lèi)型的學(xué)習有三個(gè)主要組成部分:代理(學(xué)習者或決策者)、環(huán)境(代理與之交互的所有內容)和行動(dòng)(代理可以做什么)。目標是讓代理選擇在給定時(shí)間段內最大化預期回報的行動(dòng)。如果代理遵循一個(gè)好的政策,可以更快地實(shí)現目標。因此,強化學(xué)習的重點(diǎn)是找出最佳策略。
數據挖掘、機器學(xué)習和深度學(xué)習之間有什么區別?
雖然所有這些方法都有相同的目標,提取可用于決策的見(jiàn)解、模式和關(guān)系,但它們具有不同的方法和功能。
數據挖掘可以被視為從數據中提取洞察力的許多不同方法的超集。它可能涉及傳統的統計方法和機器學(xué)習。數據挖掘應用來(lái)自多個(gè)區域的方法來(lái)識別數據中先前未知的模式。這可能包括統計算法、機器學(xué)習、文本分析、時(shí)間序列分析和其他分析領(lǐng)域。數據挖掘還包括數據存儲和操作的研究和實(shí)踐。
通過(guò)機器學(xué)習,目的是了解數據的結構。因此,統計模型背后有一個(gè)理論是經(jīng)過(guò)數學(xué)證明的,但這要求數據也滿(mǎn)足某些假設。機器學(xué)習是從使用計算機檢查數據結構的能力發(fā)展而來(lái)的,即使人們不知道這種結構是什么樣子的。機器學(xué)習模型的測試是新數據中的驗證錯誤,而不是證明空假設的理論測試。由于機器學(xué)習通常使用迭代的方法從數據中學(xué)習,因此可以輕松地自動(dòng)學(xué)習。這些步驟通過(guò)數據執行,直到找到一個(gè)可靠的標準。
深度學(xué)習結合了計算能力的進(jìn)步和特殊類(lèi)型的神經(jīng)網(wǎng)絡(luò ),以學(xué)習大量數據中的復雜模式。深度學(xué)習技術(shù)是當今最先進(jìn)的技術(shù),用于識別圖片中的對象和語(yǔ)音中的單詞。研究人員正在嘗試將模式識別方面的成功應用于更復雜的任務(wù),例如機器翻譯、醫療診斷以及許多其他社會(huì )和企業(yè)問(wèn)題。
盡管人工智能和機器學(xué)習的概念早已出現,但它們開(kāi)始成為主流應用的一部分。但是,現在仍處于起步階段。如果人工智能和機器學(xué)習有用并且令人印象深刻,當得到更好的訓練和改進(jìn)時(shí),其實(shí)施將會(huì )更加有效。
評論