码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据处理 数据挖掘 数据可视化    ( 8390个结果
Python正则(Re模块)
正则 一,简介/动机 1.1 正则的出现动机 ? 我们在学习python的路途上,有许多需要操作文本数据的场景。无论是前后端/数据库都需要处理文本数据。处理文本时候,正则表达式给我们提供了强大的搜索,匹配,抽取,替换等功能。 1.2 什么是正则表达式(regex) ? 正则表达式由一些字符和特殊符号 ...
分类:编程语言   时间:2020-07-03 23:23:44    阅读次数:83
如何决策快人一步? 用一块大屏轻松实现数据可视化
大数据时代,我们最常听到的一句话就是“用数据说话”。但数据本身都是冰冷的数字,它很难直接告诉我们哪些数据是有价值的信息。只有通过合适的可视化工具来进行数据的展示表达,才可以使传递给使用者的感受更加直观,也更容易获得其中价值。 数据大屏就是一种非常流行的数据可视化工具,它可以将业务的关键指标以可视化的 ...
分类:其他好文   时间:2020-07-03 21:39:58    阅读次数:73
机器学习融合想法记录(未完成版)
## **文档说明**本文档主要记录模型融合的有关问题:为了使项目在模型预测有更好的表现,综合机器学习方面的模型融合技术,以提升算法在解决问题的能力。 ## **使用背景** 业务情节:接单阶段; 时间段:2020 数据量:160W 特征数(本篇不对特征处理做说明):20 ## **数据处理**综合 ...
分类:其他好文   时间:2020-07-03 19:51:48    阅读次数:68
pandas,对dataFrame中某一个列的数据进行处理
背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值 下面例子中的df均为pandas.DataFrame()的数据 1、增加新列,或更改某列的值 df["列名"]=值 如果值为固定的一个值,则dataFrame中该列所有值均为这个数据 2、处理某列 df["列名"] ...
分类:其他好文   时间:2020-07-03 19:39:59    阅读次数:299
基于pySpark得地震数据处理与分析
项目来源厦门大学林子雨老师得Spark学习项目中,里面为部分项目代码和实验截图 读取文件 from pyspark import SparkConf, SparkContext from pyspark.sql import SparkSession from pyspark.ml.feature ...
分类:其他好文   时间:2020-07-03 19:04:21    阅读次数:89
新写了,发送邮件的方法,以及怎么怎么去分页循环查数据处理
import pymysql import requests import json import smtplib import email.mime.multipart import email.mime.text from email.mime.application import MIMEAp ...
分类:其他好文   时间:2020-07-03 12:36:57    阅读次数:74
数据仓库 数据可视化 Hive导出到MySql
大数据开发的最后一环,将数仓中ADS层的数据,导出到MySql,剩下就是Java工程师的事了。 1 在MySql中创建对应的ADS表,字段和类型与数仓中的表一致,略。 2 数据导出脚本。 ①--update-mode updateonly:只更新,无法插入新数据。 allowinsert:允许新增 ...
分类:数据库   时间:2020-07-02 23:16:56    阅读次数:81
MySQL高级【二】存储过程/函数/触发器
存储过程和函数 存储过程和函数概述 存储过程和函数是 事先经过编译并存储在数据库中的一段 SQL 语句的集合,调用存储过程和函数可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。 存储过程和函数的区别在于函数必须有返回值,而存储过程没有。 函数 ...
分类:数据库   时间:2020-07-02 21:21:42    阅读次数:59
肿瘤分析数据挖掘及信息解读
肿瘤基础 特点: 疾病,无线增殖 基因相关 细胞进化过程中发展异常,突变积累 概念: germline mutation: 生殖细胞突变 somatic mutation: 体细胞突变,不可遗传 driver mutation 关键突变 passenger mutation 无关紧要 二次打击学说: ...
分类:其他好文   时间:2020-07-01 23:38:46    阅读次数:221
python数据分析用什么软件?(萌新进)
Python是数据处理常用工具,可以处理数量级从几K至几T不等的数据,具有较高的开发效率和可维护性,还具有较强的通用性和跨平台性,这里就为大家分享几个不错的数据分析工具。Python数据分析需要安装的第三方扩展库有:Numpy、Pandas、SciPy、Matplotlib、Scikit-Learn、Keras、Gensim、Scrapy等,以下是第三方扩展库的简要介绍:PandasPandas是
分类:编程语言   时间:2020-07-01 20:37:12    阅读次数:73
8390条   上一页 1 ... 34 35 36 37 38 ... 839 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!