-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
回歸算法和分類算法(回歸算法和分類算法定義)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于回歸算法和分類算法的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、線性回歸算法預(yù)測的標(biāo)簽是什么型
連續(xù)型。
線性回歸預(yù)測的結(jié)果y是連續(xù)的數(shù)值,分類得到的標(biāo)簽是呈離散型的,回歸得到的標(biāo)簽是呈連續(xù)型的。
機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)算法分為分類算法和回歸算法兩種,其實就是根據(jù)類別標(biāo)簽分布類型為離散型、連續(xù)性而定義的。
二、gbase8a支持什么分類算法?
目前支持兩種分類算法:
1、Logistic回歸算法,Logistic回歸又稱logistic回歸分析,是一種廣義的線性回歸分析模型,常用于數(shù)據(jù)挖掘、疾病自動診斷和經(jīng)濟(jì)預(yù)測等領(lǐng)域。
2、支持向量機(jī)算法,
支持向量機(jī)是一種二分類模型,它的基本模型是定義在特征空間上的間隔最大的線性分類器。
說的通俗一點就是就是在特征空間里面用某條線或某塊面將訓(xùn)練數(shù)據(jù)集分成兩類,而依據(jù)的原則就是間隔最大化,這里的間隔最大化是指特征空間里面距離分離線或面最近的點到這條線或面的間隔(距離)最大。
三、人工智能算法簡介
人工智能的三大基石—算法、數(shù)據(jù)和計算能力,算法作為其中之一,是非常重要的,那么人工智能都會涉及哪些算法呢?不同算法適用于哪些場景呢?
一、按照模型訓(xùn)練方式不同可以分為監(jiān)督學(xué)習(xí)(Supervised Learning),無監(jiān)督學(xué)習(xí)(Unsupervised Learning)、半監(jiān)督學(xué)習(xí)(Semi-supervised Learning)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning)四大類。
常見的監(jiān)督學(xué)習(xí)算法包含以下幾類:
(1)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)類:反向傳播(Backpropagation)、波爾茲曼機(jī)(Boltzmann Machine)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)、Hopfield網(wǎng)絡(luò)(hopfield Network)、多層感知器(Multilyer Perceptron)、徑向基函數(shù)網(wǎng)絡(luò)(Radial Basis Function Network,RBFN)、受限波爾茲曼機(jī)(Restricted Boltzmann Machine)、回歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、自組織映射(Self-organizing Map,SOM)、尖峰神經(jīng)網(wǎng)絡(luò)(Spiking Neural Network)等。
(2)貝葉斯類(Bayesin):樸素貝葉斯(Naive Bayes)、高斯貝葉斯(Gaussian Naive Bayes)、多項樸素貝葉斯(Multinomial Naive Bayes)、平均-依賴性評估(Averaged One-Dependence Estimators,AODE)
貝葉斯信念網(wǎng)絡(luò)(Bayesian Belief Network,BBN)、貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)等。
(3)決策樹(Decision Tree)類:分類和回歸樹(Classification and Regression Tree,CART)、迭代Dichotomiser3(Iterative Dichotomiser 3, ID3),C4.5算法(C4.5 Algorithm)、C5.0算法(C5.0 Algorithm)、卡方自動交互檢測(Chi-squared Automatic Interaction Detection,CHAID)、決策殘端(Decision Stump)、ID3算法(ID3 Algorithm)、隨機(jī)森林(Random Forest)、SLIQ(Supervised Learning in Quest)等。
(4)線性分類器(Linear Classifier)類:Fisher的線性判別(Fisher’s Linear Discriminant)
線性回歸(Linear Regression)、邏輯回歸(Logistic Regression)、多項邏輯回歸(Multionmial Logistic Regression)、樸素貝葉斯分類器(Naive Bayes Classifier)、感知(Perception)、支持向量機(jī)(Support Vector Machine)等。
常見的無監(jiān)督學(xué)習(xí)類算法包括:
(1) 人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)類:生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN),前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network)、邏輯學(xué)習(xí)機(jī)(Logic Learning Machine)、自組織映射(Self-organizing Map)等。
(2) 關(guān)聯(lián)規(guī)則學(xué)習(xí)(Association Rule Learning)類:先驗算法(Apriori Algorithm)、Eclat算法(Eclat Algorithm)、FP-Growth算法等。
(3)分層聚類算法(Hierarchical Clustering):單連鎖聚類(Single-linkage Clustering),概念聚類(Conceptual Clustering)等。
(4)聚類分析(Cluster analysis):BIRCH算法、DBSCAN算法,期望最大化(Expectation-maximization,EM)、模糊聚類(Fuzzy Clustering)、K-means算法、K均值聚類(K-means Clustering)、K-medians聚類、均值漂移算法(Mean-shift)、OPTICS算法等。
(5)異常檢測(Anomaly detection)類:K最鄰近(K-nearest Neighbor,KNN)算法,局部異常因子算法(Local Outlier Factor,LOF)等。
常見的半監(jiān)督學(xué)習(xí)類算法包含:生成模型(Generative Models)、低密度分離(Low-density Separation)、基于圖形的方法(Graph-based Methods)、聯(lián)合訓(xùn)練(Co-training)等。
常見的強(qiáng)化學(xué)習(xí)類算法包含:Q學(xué)習(xí)(Q-learning)、狀態(tài)-行動-獎勵-狀態(tài)-行動(State-Action-Reward-State-Action,SARSA)、DQN(Deep Q Network)、策略梯度算法(Policy Gradients)、基于模型強(qiáng)化學(xué)習(xí)(Model Based RL)、時序差分學(xué)習(xí)(Temporal Different Learning)等。
常見的深度學(xué)習(xí)類算法包含:深度信念網(wǎng)絡(luò)(Deep Belief Machines)、深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Networks)、深度遞歸神經(jīng)網(wǎng)絡(luò)(Deep Recurrent Neural Network)、分層時間記憶(Hierarchical Temporal Memory,HTM)、深度波爾茲曼機(jī)(Deep Boltzmann Machine,DBM)、棧式自動編碼器(Stacked Autoencoder)、生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks)等。
二、按照解決任務(wù)的不同來分類,粗略可以分為二分類算法(Two-class Classification)、多分類算法(Multi-class Classification)、回歸算法(Regression)、聚類算法(Clustering)和異常檢測(Anomaly Detection)五種。
1.二分類(Two-class Classification)
(1)二分類支持向量機(jī)(Two-class SVM):適用于數(shù)據(jù)特征較多、線性模型的場景。
(2)二分類平均感知器(Two-class Average Perceptron):適用于訓(xùn)練時間短、線性模型的場景。
(3)二分類邏輯回歸(Two-class Logistic Regression):適用于訓(xùn)練時間短、線性模型的場景。
(4)二分類貝葉斯點機(jī)(Two-class Bayes Point Machine):適用于訓(xùn)練時間短、線性模型的場景。(5)二分類決策森林(Two-class Decision Forest):適用于訓(xùn)練時間短、精準(zhǔn)的場景。
(6)二分類提升決策樹(Two-class Boosted Decision Tree):適用于訓(xùn)練時間短、精準(zhǔn)度高、內(nèi)存占用量大的場景
(7)二分類決策叢林(Two-class Decision Jungle):適用于訓(xùn)練時間短、精確度高、內(nèi)存占用量小的場景。
(8)二分類局部深度支持向量機(jī)(Two-class Locally Deep SVM):適用于數(shù)據(jù)特征較多的場景。
(9)二分類神經(jīng)網(wǎng)絡(luò)(Two-class Neural Network):適用于精準(zhǔn)度高、訓(xùn)練時間較長的場景。
解決多分類問題通常適用三種解決方案:第一種,從數(shù)據(jù)集和適用方法入手,利用二分類器解決多分類問題;第二種,直接使用具備多分類能力的多分類器;第三種,將二分類器改進(jìn)成為多分類器今兒解決多分類問題。
常用的算法:
(1)多分類邏輯回歸(Multiclass Logistic Regression):適用訓(xùn)練時間短、線性模型的場景。
(2)多分類神經(jīng)網(wǎng)絡(luò)(Multiclass Neural Network):適用于精準(zhǔn)度高、訓(xùn)練時間較長的場景。
(3)多分類決策森林(Multiclass Decision Forest):適用于精準(zhǔn)度高,訓(xùn)練時間短的場景。
(4)多分類決策叢林(Multiclass Decision Jungle):適用于精準(zhǔn)度高,內(nèi)存占用較小的場景。
(5)“一對多”多分類(One-vs-all Multiclass):取決于二分類器效果。
回歸
回歸問題通常被用來預(yù)測具體的數(shù)值而非分類。除了返回的結(jié)果不同,其他方法與分類問題類似。我們將定量輸出,或者連續(xù)變量預(yù)測稱為回歸;將定性輸出,或者離散變量預(yù)測稱為分類。長巾的算法有:
(1)排序回歸(Ordinal Regression):適用于對數(shù)據(jù)進(jìn)行分類排序的場景。
(2)泊松回歸(Poission Regression):適用于預(yù)測事件次數(shù)的場景。
(3)快速森林分位數(shù)回歸(Fast Forest Quantile Regression):適用于預(yù)測分布的場景。
(4)線性回歸(Linear Regression):適用于訓(xùn)練時間短、線性模型的場景。
(5)貝葉斯線性回歸(Bayesian Linear Regression):適用于線性模型,訓(xùn)練數(shù)據(jù)量較少的場景。
(6)神經(jīng)網(wǎng)絡(luò)回歸(Neural Network Regression):適用于精準(zhǔn)度高、訓(xùn)練時間較長的場景。
(7)決策森林回歸(Decision Forest Regression):適用于精準(zhǔn)度高、訓(xùn)練時間短的場景。
(8)提升決策樹回歸(Boosted Decision Tree Regression):適用于精確度高、訓(xùn)練時間短、內(nèi)存占用較大的場景。
聚類
聚類的目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)的潛在規(guī)律和結(jié)構(gòu)。聚類通常被用做描述和衡量不同數(shù)據(jù)源間的相似性,并把數(shù)據(jù)源分類到不同的簇中。
(1)層次聚類(Hierarchical Clustering):適用于訓(xùn)練時間短、大數(shù)據(jù)量的場景。
(2)K-means算法:適用于精準(zhǔn)度高、訓(xùn)練時間短的場景。
(3)模糊聚類FCM算法(Fuzzy C-means,F(xiàn)CM):適用于精確度高、訓(xùn)練時間短的場景。
(4)SOM神經(jīng)網(wǎng)絡(luò)(Self-organizing Feature Map,SOM):適用于運行時間較長的場景。
異常檢測
異常檢測是指對數(shù)據(jù)中存在的不正?;蚍堑湫偷姆煮w進(jìn)行檢測和標(biāo)志,有時也稱為偏差檢測。
異常檢測看起來和監(jiān)督學(xué)習(xí)問題非常相似,都是分類問題。都是對樣本的標(biāo)簽進(jìn)行預(yù)測和判斷,但是實際上兩者的區(qū)別非常大,因為異常檢測中的正樣本(異常點)非常小。常用的算法有:
(1)一分類支持向量機(jī)(One-class SVM):適用于數(shù)據(jù)特征較多的場景。
(2)基于PCA的異常檢測(PCA-based Anomaly Detection):適用于訓(xùn)練時間短的場景。
常見的遷移學(xué)習(xí)類算法包含:歸納式遷移學(xué)習(xí)(Inductive Transfer Learning) 、直推式遷移學(xué)習(xí)(Transductive Transfer Learning)、無監(jiān)督式遷移學(xué)習(xí)(Unsupervised Transfer Learning)、傳遞式遷移學(xué)習(xí)(Transitive Transfer Learning)等。
算法的適用場景:
需要考慮的因素有:
(1)數(shù)據(jù)量的大小、數(shù)據(jù)質(zhì)量和數(shù)據(jù)本身的特點
(2)機(jī)器學(xué)習(xí)要解決的具體業(yè)務(wù)場景中問題的本質(zhì)是什么?
(3)可以接受的計算時間是什么?
(4)算法精度要求有多高?
————————————————
原文鏈接: https://blog.csdn.net/nfzhlk/article/details/82725769
四、回歸算法有哪些
回歸分析是一種預(yù)測性的建模技術(shù),它研究的是因變量(目標(biāo))和自變量(預(yù)測器)之間的關(guān)系。這種技術(shù)通常用于預(yù)測分析,時間序列模型以及發(fā)現(xiàn)變量之間的因果關(guān)系。例如,司機(jī)的魯莽駕駛與道路交通事故數(shù)量之間的關(guān)系,最好的研究方法就是回歸。
回歸分析是建模和分析數(shù)據(jù)的重要工具。在這里,我們使用曲線/線來擬合這些數(shù)據(jù)點,在這種方式下,從曲線或線到數(shù)據(jù)點的距離差異最小。
以上就是關(guān)于回歸算法和分類算法相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
回歸營銷基本層面讀后感(銷售的常識-回歸銷售的本質(zhì),重構(gòu)你的銷售思維下載)