使用Python进行异常检测的解决方案 - OFweek 人工智能网

当前位置： OFweek 人工智能网 > 其他 > 正文

使用Python进行异常检测的解决方案

2020-10-26 08:44

计算每个特征的平均值。这里我们只有两个特征：0和1。s ＝ np．sum（df， axis＝0）

mu ＝ s／m

mu

输出：0 14．112226

1 14．997711

dtype： float64

根据上面“公式和过程”部分中描述的公式，让我们计算方差：vr ＝ np．sum（（df － mu）＊＊2， axis＝0）

variance ＝ vr／m

variance

输出：0 1．832631

1 1．709745

dtype： float64

现在把它做成对角线形状。正如我在概率公式后面的“公式和过程”一节中所解释的，求和符号实际上是方差var＿dia ＝ np．diag（variance）

var＿dia

输出：array（［［1．83263141， 0．］，

［0．， 1．70974533］］）

计算概率：k ＝ len（mu）

X ＝ df － mu

p ＝ 1／（（2＊np．pi）＊＊（k／2）＊（np．linalg．det（var＿dia）＊＊0．5））＊ np．exp（－0．5＊ np．sum（X ＠ np．linalg．pinv（var＿dia）＊ X，axis＝1））
p

使用Python进行异常检测的解决方案

训练部分已经完成。下一步是找出阈值概率。如果概率低于阈值概率，则样本数据为异常数据，但我们需要为我们的特殊情况找出那个阈值。对于这一步，我们使用交叉验证数据和标签。对于你的案例，你只需保留一部分原始数据以进行交叉验证。现在导入交叉验证数据和标签：cvx ＝ pd．read＿excel（＇ex8data1．xlsx＇， sheet＿name＝＇Xval＇， header＝None）

cvx．head（）

使用Python进行异常检测的解决方案

标签如下：cvy ＝ pd．read＿excel（＇ex8data1．xlsx＇， sheet＿name＝＇y＇， header＝None）

cvy．head（）

使用Python进行异常检测的解决方案

把＇cvy＇转换成NumPy数组。y ＝ np．array（cvy）

输出：＃数组的一部分

array（［［0］，
［0］，
［0］，
［0］，
［0］，
［0］，
［0］，
［0］，
［0］，

这里，y值为0表示这是一个正常的样本，y值为1表示这是一个异常的样本。选择阈值首先让我们再检查一下概率值。p．describe（）

输出：count 3．070000e＋02

mean 5．905331e－02

std 2．324461e－02

min 1．181209e－23

25％ 4．361075e－02

50％ 6．510144e－02

75％ 7．849532e－02

max 8．986095e－02

dtype： float64

<上一页 1 2 3 下一页>

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

人工智能猎头职位更多

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

扫码关注公众号
OFweek人工智能网
获取更多精彩内容

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号