#LOF异常检测算法主要用异常点的检测输出from scipy.spatial.distance import cdistimport numpy as npclass LOF: def __init__(self, data, k, epsilon=1.0): self.data = data s ...
分类:
编程语言 时间:
2020-07-23 22:41:37
阅读次数:
93
Task2 数据读取与数据分析 一、数据读取 1 import pandas as pd 2 train_df = pd.read_csv('./train_set.csv', sep='\t') 首先对read_csv的函数有个清晰的认识,具体的参数的情况如下: filepath_or_buffe ...
分类:
其他好文 时间:
2020-07-23 16:48:28
阅读次数:
119
1. sklearn中的Pipeline机制 管道机制在机器学习算法中的应用:参数集在新数据集(比如测试集)上的重复使用。 管道机制实现流式化封装和管理。 主要有两点好处: 可直接调用fit和predict方法对pipeline中的所有算法模型进行训练和预测 可结合grid search对参数进行选 ...
分类:
其他好文 时间:
2020-07-23 16:15:38
阅读次数:
78
##Task2 数据读取与数据分析 ####1.学习目标 学习使用Pandas读取赛题数据 分析赛题数据的分布规律 ####2.数据读取 代码示例: import pandas as pd file_dir = "nlp_data_list" train_df = pd.read_csv("./{} ...
分类:
其他好文 时间:
2020-07-23 01:45:01
阅读次数:
80
replace() 既可以替换某列,也可以替换某行,还可以全表替换 df.replace() 或者 df[col]replace() #参数如下: df.replace(to_replace=None, value=None, inplace=False, limit=None, regex=Fal ...
分类:
其他好文 时间:
2020-07-22 20:36:06
阅读次数:
129
原文连接:https://www.yiibai.com/pandas/python_pandas_environment_setup.html sudo apt-get install python-numpy python-scipy python-matplotlib python-pandas ...
分类:
编程语言 时间:
2020-07-22 15:52:49
阅读次数:
63
Pandas的Merge相当于sql的join,将不同的表关联在一个表 #读取电影数据,sep为分割符 df_ratings=pd.read_csv(r'...\datas\movielens-1m\ratings.dat',sep='',engine='python',names='UserIDM ...
分类:
其他好文 时间:
2020-07-21 23:22:47
阅读次数:
88
NLP——新闻文本处理:TASK1 赛题理解与nlp初识 1.数据读取 在竞赛主页下载好数据集利用pandas打开: #coding=utf-8 import pandas as pd #my_font = font_manager.FontProperties(fname="C:\Windows\ ...
分类:
其他好文 时间:
2020-07-21 23:13:12
阅读次数:
112
df.append(df2,ignore_index=False),按行添加 ...
分类:
其他好文 时间:
2020-07-21 23:10:42
阅读次数:
62
整理今天的代码…… 采用的是150条鸢尾花的数据集fishiris.csv # 读入数据,把Name列取出来作为标签(groundtruth) import pandas as pd data = pd.read_csv('fishiris.csv') print(data.head(5)) X = ...
分类:
编程语言 时间:
2020-07-21 09:45:22
阅读次数:
138