文章存档
人工智能&大数据
2020-05-08 20:53:41
1 概述
贝叶斯分类算法是一大类分类算法的总称。贝叶斯分类算法以样本可能属于某类的概率来作为分类依据。朴素贝叶斯(Naive Bayes)分类算法是贝叶斯分类算法中最简单的一种。
注:朴素的意思是条件概率独立性
2 算法思想
朴素贝叶斯的思想是这样的:如果一个事物在一些属性条件发生的情况下,事物属于A的概率>属于B的概率,则判定事物属于A。
通俗来说,你在街上看到一个黑人
2020-05-07 21:13:52
K最近邻(k-Nearest Neighbor,KNN)分类算法,通过测量不同特征值之间的距离进行分类,其指导思想是“近朱者赤,近墨者黑”,如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常为不大于20的整数。
KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 如下图所示,要决定绿
2020-05-06 17:56:20
机器学习是一种能从数据中学习的计算机编程科学以及艺术,就像下面这句话说得一样。
机器学习是使计算机无需显式编程就能学习的研究领域。——阿瑟·塞缪尔,1959年
不过还有一个更好的定义:
“如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认为是“具备学习能力的”,那么它一定需要展现出:利用现有的经验(E),不断改善其
2019-04-24 23:26:24
机器学习十大算法
https://www.jianshu.com/p/55a67c12d3e9
2019-04-24 23:15:58
https://blog.csdn.net/u013270347/article/details/80604690
http://math.hws.edu/eck/js/sorting/xSortLab.html
2019-04-24 09:16:41
递归
https://blog.csdn.net/justloveyou_/article/details/71787149
2019-04-24 09:13:22
算法主要有四类:分类,回归,聚类,降维。其中:
常用的回归:线性、决策树、SVM、KNN ;集成回归:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用的分类:线性、决策树、SVM、KNN,朴素贝叶斯;集成分类:随机森林、Adaboost、GradientBoosting、Bagging、ExtraTrees
常用聚类:k均值(K-mea
2019-04-11 20:38:35
第一章 算法简介
1 二分查找
二分查找是一种算法,其输入是一个有序的元素列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。
猜想1-100中的一个数字,7次内就能猜到。
如果是在240000个单词的字典中找寻一个单词,只需要18步。
2019-02-26 17:13:13
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
源码地址为:https://github.com/tesserac
2019-01-28 19:14:20
一、函数简介
1、zeros—构造全0矩阵
函数原型:zeros(shape, dtype=None, order=’C’)
shape:矩阵大小;例如:300x300;
dtype:数据类型;例如:”uint8”
order:数据排列顺序,默认按列排的
2、line—画线
函数原型:line(img, pt1, pt2, color
2019-01-03 21:36:50
机器学习原理,及常见算法
https://www.cnblogs.com/nxld/p/6059509.html