安装 sklearn.datasets 这个包提供一些函数用于读取样本数据(数据存在 .csv 或 .csv.gz 文件),比如 酒数据集(用于分类) 13 个特征包括各种成分的含量、酒的颜色等 3 个分类简单的标记为 class_0、class_1、class_2 参数 return_X_y 表示 ...
分类:
其他好文 时间:
2020-03-27 01:01:09
阅读次数:
135
""" K-近邻算法(KNN):如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别) K取值问题:取小容易受异常值影响,取太大预测准确率不好 性能问题:时间复杂度很高,计算量太大,适用小数据场景,于几千~几万样本 """ from skl ...
分类:
编程语言 时间:
2020-03-26 01:13:03
阅读次数:
86
问题描述 回文串,是一种特殊的字符串,它从左往右读和从右往左读是一样的。小龙龙认为回文串才是完美的。现在给你一个串,它不一定是回文的,请你计算最少的交换次数使得该串变成一个完美的回文串。 交换的定义是:交换两个相邻的字符 例如mamad 第一次交换 ad : mamda 第二次交换 md : mad ...
分类:
其他好文 时间:
2020-03-25 21:46:11
阅读次数:
67
# -*- coding: utf-8 -*- import requests, re import time import os import csv import sys import importlib from fake_useragent import UserAgent importli ...
分类:
编程语言 时间:
2020-03-25 21:37:36
阅读次数:
99
在 "SourceForge" 上找到读写csv文件的开源代码。 但是生成的csv文件,如果用excel打开时,中文全部会乱码。原因是excel在解析csv文件时,默认以utf 8带BOM格式去解析的。 utf 8保存的csv格式文件要让Excel正常打开的话,必须加入在文件最前面加入BOM(Byt ...
分类:
编程语言 时间:
2020-03-25 21:04:26
阅读次数:
89
1 背景 用户本地有一份txt或者csv文件,无论是从业务数据库导出、还是其他途径获取,当需要使用蚂蚁的大数据分析工具进行数据加工、挖掘和共创应用的时候,首先要将本地文件上传至ODPS,普通的小文件通过浏览器上传至服务器,做一层中转便可以实现,但当这份文件非常大到了10GB级别,我们就需要思考另一种 ...
分类:
Web程序 时间:
2020-03-25 18:49:49
阅读次数:
85
import pandas as pd pd.options.display.max_rows = 10 # 设置显示行数 df1 = pd.read_csv(r'E:\anacondatest\PythonData\高校信息.csv', encoding='gbk', index_col='学校名 ...
分类:
其他好文 时间:
2020-03-25 01:23:25
阅读次数:
90
import pandas as pd pd.options.display.max_rows = 10 # 设置显示行数 df1 = pd.read_csv(r'E:\anacondatest\PythonData\PM25\Beijing_2009_HourlyPM25_created20140 ...
分类:
其他好文 时间:
2020-03-25 01:08:34
阅读次数:
63
import pandas as pd pd.options.display.max_rows = 10 # 设置显示行数 df1 = pd.read_csv(r'E:\anacondatest\PythonData\高校信息.csv', encoding='gbk', index_col='学校名 ...
分类:
其他好文 时间:
2020-03-25 01:05:00
阅读次数:
78
import pandas as pd pd.options.display.max_rows = 10 # 设置显示行数 #读入是直接指定索引 df1 = pd.read_csv(r'E:\anacondatest\PythonData\高校信息.csv', encoding='gbk', ind ...
分类:
其他好文 时间:
2020-03-24 21:39:38
阅读次数:
70