码迷,mamicode.com
首页 >  
搜索关键字:预训练模型    ( 87个结果
全面解析Pytorch框架下模型存储,加载以及冻结
最近在做试验中遇到了一些深度网络模型加载以及存储的问题,因此整理了一份比较全面的在 PyTorch 框架下有关模型的问题。首先咱们先定义一个网络来进行后续的分析: 1、本文通用的网络模型 import torch import torch.nn as nn ''' 定义网络中第一个网络模块 Net1 ...
分类:其他好文   时间:2021-07-01 17:35:47    阅读次数:0
AIApe问答机器人NLP模型介绍
机器人NLP模型介绍 1. 预训练模型 首先试验了以下三个预训练模型在语义相似度任务上的效果: hfl-chinese-roberta-wwm-ext hfl-chinese-roberta-wwm-ext-large bert-base-chinese 处于效率的考虑,进行语义相似度任务的时候不是 ...
分类:其他好文   时间:2021-06-16 17:50:04    阅读次数:0
使用Tensorflow Object Detection进行训练和推理
整体流程(以PASCAL VOC为例) 1.下载PASCAL VOC2012数据集,并将数据集转为tfrecord格式 2.选择并下载预训练模型 3.配置训练文件configuration(所有的训练参数都通过配置文件来配置) 4.训练模型 5.利用tensorboard查看训练过程中loss,ac ...
分类:其他好文   时间:2021-04-27 14:57:01    阅读次数:0
用keras_bert实现多输出、参数共享模型
背景 在nlp领域,预训练模型bert可谓是红得发紫。 但现在能搜到的大多数都是pytorch写的框架,而且大多都是单输出模型。 所以,本文以 有相互关系的多层标签分类 为背景,用keras设计了多输出、参数共享的模型。 keras_bert基础应用 def batch_iter(data_path ...
分类:其他好文   时间:2021-03-08 13:18:36    阅读次数:0
超一流 | 从XLNet的多流机制看最新预训练模型的研究进展
关注小夕并星标,解锁自然语言处理搜索、推荐与算法岗求职秘籍导读作为NLP近两年来的当红炸子鸡,以ELMo/BERT为代表的语言预训练技术相信大家已经很熟悉了。简单回顾下18年以来几个预训练的重要工作:ELMo,GPTandBERTELMo首先提出了基于语言模型的预训练技术,成功验证了在大规模语料上基于语言模型进行文本自监督学习的有效性。GPT提出了NLP预训练技术使用时应该像CV预训练技术一样,在
分类:Web程序   时间:2020-12-29 11:05:29    阅读次数:0
Longformer:超越RoBERTa,为长文档而生的预训练模型
前言今天要与大家分享的是AllenAI今年发表的最新工作,Longformer——一种可高效处理长文本的升级版Transformer。作者团队提供了开源代码,大家可快速复现,直接用于自己的任务。传统Tranformer-based模型在处理长文本时有着天然的劣势。因为传统模型采用的是“全连接”型的attention机制,即每一个token都要与其他所有token进行交互。其attention复杂度
分类:其他好文   时间:2020-12-29 11:04:31    阅读次数:0
4项探索+4项实践,带你了解华为云视觉预训练研发技术
摘要:本文主要讲述云原生时代华为云在AI基础研究、视觉预训练模型研发和行业实践,以及AI开发平台ModelArts的最新进展。 近日,在Qcon全球软件开发大会(深圳站)上,华为云人工智能领域首席科学家、IEEE FELLOW田奇博士,发表了“云原生时代,视觉预训练大模型探索与实践”的主题演讲,介绍 ...
分类:其他好文   时间:2020-12-15 11:49:26    阅读次数:1
config.json 预训练模型调参
(来自BERT论文) config文件定义了模型的超参数。 但是,由于此模型在64GB内存上训练,所以如果个人使用的话,需要调整超参数。 内存大小影响因子包括: max_seq_length,发布模型长度不超过512,你可以使用更短的。 train_batch_size(成正比) Model typ ...
分类:Web程序   时间:2020-10-26 11:39:20    阅读次数:44
详解OpenVINO 模型库中的人脸检测模型
OpenVINO支持的人脸检测详解与实验对比~!
分类:其他好文   时间:2020-10-20 16:21:59    阅读次数:23
Waymo 开源最大自动驾驶数据集【智能快讯】
https://mp.weixin.qq.com/s/LoZ1qTgh1iEvQWGSDw14KwBy超神经AI无处不在的时代,每天都有新的技术与研究成果出现。无论学术界还是商界,技术还是产品,AI的新发现都源源不断,在带给我们全新视角的同时,也引起我们更深的思考。HyperAI超神经精心整理了AI行业的近期资讯,快来一起围观吧!学界斯坦福大学研究人员研发智能水龙头可帮助人们节约用水斯坦福大学机械
分类:其他好文   时间:2020-09-18 12:26:28    阅读次数:43
87条   1 2 3 4 ... 9 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!