-
【云+社区年度征文】成功交付20+NLP技能后,AI产品经理总结的实战方法论
在此期间,头脑风暴大概了100多个想法,推演细化期间拍死一半,开发过程中又夭折一半,最终交付到客户手上的对话技能已经超过了20多个。
饭大官人 2023-01-02460 0 0 -
DNN深度学习模型 机器学习模型 特征筛选 各个特征重要度排序
在机器学习或者深度学习模型训练完成后,通常我们需要对输入特征进行重要度排序及筛选,好去找到一些重要度没这么高的特征,将其排除以提高模型收敛速度及准确率。
大鹅 2023-01-02462 0 0 -
Embedding 背景 发展 生成方法 在推荐中的应用
随着深度学习在工业届不断火热,Embedding技术便作为“基本操作”广泛应用于推荐、广告、搜索等互联网核心领域中。Embedding作为深度学习的热门研究方向...
大鹅 2023-01-02477 0 0 -
NLP之从word2vec到ELMO GPT再到BERT与attention transformer过程笔记与详解
在NLP自然语言处理学习或者发展过程中,在13年word2vec word embedding后,人们发现一个单词通过Word Embedding表示,很容易找...
大鹅 2023-01-02476 0 0 -
arXiv | 如何更好地理解自然语言?自训练+预训练
今天给大家介绍的是Facebook AI研究团队发表在arXiv上的一篇文章“Self-training Improves Pre-training for N...
DrugAI 2023-01-02458 0 0 -
jieba结巴分词原理浅析与理解 HMM应用在中文分词 及部分代码阅读
这篇博客主要阐述我们在分词任务中常用的分词库结巴jieba分词的实现原理,以及之前博客中讲到的HMM在分词中的应用,算是复习与加深理解一下HMM的知识。jieb...
大鹅 2023-01-02452 0 0 -
HanLP使用教程——NLP初体验
话接上篇NLP的学习坑 自然语言处理(NLP)——简介 ,使用HanLP进行分词标注处词性。
SpringSun 2023-01-02462 0 0 -
使用transformer BERT预训练模型进行文本分类 及Fine-tuning
Bert 全称为 Bidirectional Encoder Representations from Transformers(Bert)。和 ELMo 不同...
大鹅 2023-01-02449 0 0 -
BERT系列RoBERTa ALBERT ERINE详解与使用学习笔记
继上一篇博客,这篇主要讲一下BERT以及BERT衍生的模型,如RoBERTa ALBERT ERINE等模型的改进与优化效果。
大鹅 2023-01-02493 0 0 -
NLP BERT GPT等模型中 tokenizer 类别说明详解
在使用GPT BERT模型输入词语常常会先进行tokenize ,tokenize具体目标与粒度是什么呢?tokenize也有许多类别及优缺点,这篇文章总结一下...
大鹅 2023-01-02446 0 0