最近在工作中有一个需求:用训练好的模型将数据库中所有数据得出预测结果,并保存到另一张表上。数据库中的数据是一篇篇文章,我训练好的模型是对其中的四个段落分别分类,即我有四个模型,拿到文本后需要提取出这四个段落,并用对应模型分别预测这四个段落的类别,然后存入数据库中。我是用keras训练的模型,back ...
分类:
系统相关 时间:
2020-01-14 19:05:52
阅读次数:
322
前提 AWK是一种处理文本文件的语言,是一个强大的文本分析工具。 本文将使用命令awk将具有某个关键字的段落提取出来。 准备数据 段落提取 假设我们需要的关键字为 nid=0x63ef ...
分类:
其他好文 时间:
2020-01-13 00:49:16
阅读次数:
371
这篇文章是阅读AMiner《2018自然语言处理研究报告》前几篇内容整理所得。 ...
分类:
编程语言 时间:
2020-01-12 00:14:06
阅读次数:
522
(一)为何学习MarkDown 作为编程开发人员免不了编写自己的工作日志以及开发文档,编写文档的软件有很多,常用的有txt文本编辑器、word、html甚至是ps。但是这些软件或多或少都存在一定的缺陷,文本编辑器太过轻量仅仅能记录文字一些专业符号是不可能实现的;word太过于庞大还需要下载专门插件, ...
分类:
其他好文 时间:
2020-01-09 00:54:15
阅读次数:
91
标题:将文字显示成标题的的样子h1 <h1>标题文字<h1>h2h3h4h5h6段落<p></p><pre></pre>段落标签:细节:浏览解析器 空格 n个空格 换行 都会只解析一个空白字符(空格)p:段落文字pre:段落文字 保留html源文档的格式(空格,换行,标签)特殊字符:空格   ...
分类:
Web程序 时间:
2020-01-08 14:24:06
阅读次数:
97
时至今日,SpringBoot 系列文章也算是告一段落,回想起当初立flag的情景,仿佛还历历在目。用一个月时间学完 SpringBoot 并整理成文章?又定一些异想天开计划,当时这样想着。不过,虽然过程比较艰辛,但结局也还算完美,在最后一篇文章完成那一刻,心情却很平静,我想,大概是习以为常了吧。 ...
分类:
编程语言 时间:
2020-01-08 00:16:28
阅读次数:
104
pdf编辑器 pdf 转Word pdf转PPT pdf转Excel 段落编辑,文本可在多pdf编辑器个段落、多栏、多个页面中自动重排。 通过移动文本块、更改文本块大小或对齐文本,调整pdf编辑器文档布局。 支持添加图章、水印、页眉、页脚、制作pdf编辑器专业的PDF文档。 pdf编辑器 获取方式见 ...
分类:
其他好文 时间:
2020-01-07 22:49:14
阅读次数:
108
Markdown基本语法 标题 使用 表示1 6级标题,第一级用一个 表示,第二级用两个 表示,以此类推。 分隔线 输入连续三个以上的 、` _`然后回车可以生成分割线。 段落 使用空行来作为一个新段落的开始。 字体 脚注 列表 1. 无序列表 无序列表使用 、`+ `加空格作为列表标记 2. 有序 ...
分类:
其他好文 时间:
2020-01-06 09:32:41
阅读次数:
70
html的标签以及常用的属性 1.段落标签 :<p> <br> 2.文字标签:font-size <h1><font face = "verdana">666666</font></h1> <p><font size = "5" face = "arial" color = "red">897897 ...
分类:
Web程序 时间:
2020-01-05 00:00:06
阅读次数:
110
# 导入扩展库import re # 正则表达式库import collections # 词频统计库import numpy as np # numpy数据处理库import jieba # 结巴分词import wordcloud # 词云展示库from PIL import Image # 图 ...
分类:
编程语言 时间:
2020-01-04 11:05:07
阅读次数:
81