- 博客(73)
- 资源 (23)
- 收藏
- 关注

原创 NLTK结合stanfordnlp工具包使用方法总结
简述NLTK 是一款著名的 Python 自然语言处理(Natural Language Processing, NLP)工具包,在其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER)、句法分析(Syntactic Parse)等各项 NL...
2019-03-06 01:20:22
10165
7

转载 Speech and Natural Language Processing相关资源列表
Refer tohttps://github.com/edobashira/speech-language-processingA curated list of speech and natural language processing resources. Other lists can be found in thislist. If you want to contribute ...
2019-03-04 20:55:40
776
原创 ERROR: No matching distribution found for httpstan<4.5,>=4.4解决方法
问题在MINGW中用python -m pip install matplotlib 命令安装matplotlib后显示pystan没有安装成功,因此继续用python -m pip install pystan去安装pystan,结果报错信息为ERROR:Could not find a version that satisfies the requirement httpstan<4.5,>=4.4 (from pystan>=2.14->fbprophet) (from
2021-04-30 01:47:41
4949
转载 GitHub上优秀的Go开源项目(转载)
转载自http://www.flysnow.org/2016/12/27/golang-hot-project-in-github.html近一年来,学习和研究Go语言,断断续续的收集了一些比较优秀的开源项目,这些项目都非常不错,可以供我们学习和研究Go用,从中可以学到很多关于Go的使用、技巧以及相关工具和方法。我把他们整理发出来,大家有兴趣可以根据自己的爱好选择一些进行研究和
2020-10-12 00:13:48
6775
原创 [LeetCode] 601. Human Traffic of Stadium
X city built a new stadium, each day many people visit it and the stats are saved as these columns:id,visit_date,peoplePlease write a query to display the records which have 3 or more consecutive rows and the amount of people more than 100(inclusive)....
2020-10-09 10:18:26
355
原创 [LeetCode] 626. Exchange Seats
Mary is a teacher in a middle school and she has a tableseatstoring students' names and their corresponding seat ids.The columnidis continuous increment.Mary wants to change seats for the adjacent students.+---------+---------+| id | stude...
2020-10-09 09:18:23
235
原创 [LeetCode] 627. Swap Salary
Given a tablesalary, such as the one below, that has m=male and f=female values. Swap all f and m values (i.e., change all f values to m and vice versa) with asingle update statementand no intermediate temp table.Note that you must write a single upda...
2020-10-09 00:23:27
142
原创 [LeetCode] 595. Big Countries
There is a tableWorld+-----------------+------------+------------+--------------+---------------+| name | continent | area | population | gdp |+-----------------+------------+------------+--------------+---------------+.
2020-10-08 23:57:44
149
原创 [LeetCode] 620. Not Boring Movies
X city opened a new cinema, many people would like to go to this cinema. The cinema also gives out a poster indicating the movies’ ratings and descriptions.Please write a SQL query to output movies with an odd numbered ID and a description that is not 'b
2020-10-08 23:51:53
140
转载 英文关键词提取之RAKE算法
转载自https://zhikaizhang.cn/RAKE算法是由2010年的论文Automatic keyword extraction from individual documents提出的,比TextRank算法效果更好,原repository链接是https://github.com/aneesha/RAKE,已经很久没有维护了,本文重新整理了代码,做了以下3个工作:使其支持...
2020-04-08 20:19:06
4239
原创 Jupyter notebook 报错 500 : Internal Server Error的解决方法
问题: 输入jupyter notebook后再浏览器点击.ipynb文件报错500 Internal Server Error,异常如下图所示解决方法:1). 先卸载jupyter并删除安装目录下的以jupyter开头的文件,再重新pip install jupyter安装jupyter,试验后再打开jupyter notebook, 仍无法正常打开.i...
2020-02-26 09:56:45
54554
46
原创 解决问题module 'tensorflow.compat.v2' has no attribute 'contrib'和ImportError cannot import name 'auto'
Error:当前tensorflow的版本是1.13.1和2.0.0b1报错module 'tensorflow.compat.v2' has no attribute 'contrib',尝试用import tensorflow.compat.v1 as tf 代替import tensorflow as tf,但仍有问题 ImportError cannot import name...
2020-02-04 11:45:10
33270
11
原创 ModuleNotFoundError: no module named ‘pip‘解决方法
问题:Python3.6版执行命令行 pip install --upgrade pip升级pip后, 再安装numpy时报错ModuleNotFoundError,如下图所示解决方法:在控制台输入以下命令后即可解决python -m ensurepip正确的升级方式是python -m pip install --upgrade pip结果如...
2019-10-24 17:15:05
10387
5
原创 解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 212: illegal multibyte sequence
问题:在cmd命令行输入python后报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 212: illegal multibyte sequence分析:读取文件时报错Unicode编码错误,一般这种情况较多是在国标码(GBK)和utf8之间选择出现了问题。这个异常报错是由于设置了参数err...
2019-10-11 00:51:03
17824
原创 解决ModuleNotFoundError: No module named 'numpy.core._multiarray_umath'的方法
问题: 导入tensorflow时报错ModuleNotFoundError: No module named 'numpy.core._multiarray_umath',异常信息如下所示分析: NumPy是使用Python进行科学计算的基础软件包,这里提示numpy.core._multiarray_umath failed to import和numpy.co...
2019-10-10 15:15:50
42756
3
转载 Bert资源整理
转载自:https://mp.weixin.qq.com/s/q5OyrIycfN4fjQ33uSRmEA整理一下BERT相关的资源,包括Paper, 代码和文章解读。1、Google官方:1)BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding一切始于10月Google祭...
2019-07-26 01:51:23
825
转载 BERT模型深度解析
转载自: https://blog.youkuaiyun.com/qq_39521554/article/details/83062188github:NLP-BERT--Python3.6-pytorch一、前言 去年谷歌AI团队新发布的BERT模型,在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:全部两个衡量指标上全面超越人类,并且还在11种不同NLP测试中创出...
2019-07-26 01:48:27
6027
转载 概率语言模型3——训练工具汇总
转载自https://www.itread01.com/content/1547467935.html傳統演算法1) BerkeleyLM 是用java寫的,號稱跟KenLM差不多,記憶體比srilm小https://github.com/adampauls/berkeleylm2)MITLM (The MIT Language Modeling toolkit) 引數優化做...
2019-07-03 14:16:22
726
转载 Redis v.s Memcache
转载自https://www.cnblogs.com/457248499-qq-com/p/7392653.html观点一:1、Redis和Memcache都是将数据存放在内存中,都是内存数据库。不过memcache还可用于缓存其他东西,例如图片、视频等等;2、Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储;3、虚拟内存--R...
2019-06-24 14:28:16
112
转载 Lecture 01-05 Basic —— Hinton课程
转载自https://www.cnblogs.com/jesse123/p/7131929.htmlLink:Neural Networks for Machine Learning -多伦多大学Link:Hinton的CSC321课程笔记1Link:Hinton的CSC321课程笔记2一年后再看课程,亦有收获,虽然看似明白,但细细推敲其实能挖掘出很多深刻的内容;以下为在线...
2019-06-22 14:59:08
418
转载 搜索引擎系统的原理和实践
转载自https://www.cnblogs.com/binyue/p/3464052.html搜索引擎的原理和分析指标(1)搜索引擎的工作原理搜索引擎的工作原理大致可以分为:搜集信息:搜索引擎的一个部分可以实现信息自动搜集。整理信息:搜索引擎通过创建索引为抓取到的信息添加规则。接受查询:用户向搜索引擎输入关键词提交查询,系统接受用户查询,并且排序后并返回查询结果。搜索引擎根据每...
2019-06-21 10:16:10
2196
转载 lecture16 联合模型、分层坐标系、超参数优化及本课未来的探讨——Hinton课程
转载自https://www.cnblogs.com/shouhuxianjian/p/4529166.html这是HInton的第16课,也是最后一课。一、学习一个图像和标题的联合模型在这部分,会介绍一些最近的在学习标题和描述图片的特征向量的联合模型上面的工作。在之前的lecture中,介绍了如何从图像中提取语义有意义的特征。不过那是在没有从标题中得到帮助的情况下做的。显然在标...
2019-06-21 01:23:50
355
转载 Lecture 09 & 10 Bayesian——Hinton课程
Link:Neural Networks for Machine Learning -多伦多大学Link:Hinton的CSC321课程笔记Lecture 09Lecture 10提高泛化能力介绍不同的方法去控制网络的数据表达能力,并介绍当我们使用这样一种方法的时候如何设置元参数,然后给出一个通过提早结束训练来控制网络能力(其实就是防止过拟合)的例子。所以...
2019-06-21 01:12:31
237
转载 Lecture 06 Converage——Hinton课程
转载自https://www.cnblogs.com/jesse123/p/7171027.htmlLink:Neural Networks for Machine Learning -多伦多大学Link:Hinton的CSC321课程笔记Ref:神经网络训练中的Tricks之高效BP (反向传播算法)关于梯度下降的东西,涉及的知识很多,有必要单独一章Lectur...
2019-06-21 01:03:49
1673
转载 Lecture 07 & 08 RNN---Hinton课程
转载自https://www.cnblogs.com/jesse123/p/7181320.htmlLink:Neural Networks for Machine Learning -多伦多大学Link:Hinton的CSC321课程笔记补充:参见cs231n 2017版本,ppt写得比过去更好。[译] 理解 LSTM 网络:模块内部解析讲得不错。Lecture 0...
2019-06-21 00:57:40
291
转载 Lecture 11 & 12 Hopfield Nets and Boltzmann Machine——Hinton课程
转载自https://www.cnblogs.com/jesse123/p/7193308.html注:部分课件源于Hinton的课程 Neural Networks for Machine Learning 之Hopfield Nets 和Boltzmann MachineLecture 11 — Hopfield NetsLecture 12 — Boltzmann machine...
2019-06-21 00:51:20
434
原创 Pytorch实现一个用于学习正态分布的GAN网络
2014 年,Ian Goodfellow 和他在蒙特利尔大学的同事发表了一篇震撼学界的论文《Generative Adversarial Nets》,这标志着生成对抗网络(GAN)的诞生,而这是通过对计算图和博弈论的创新性结合。研究显示:给定充分的建模能力,两个博弈模型能够通过简单的反向传播(backpropagation)来协同训练。这两个模型的角色定位十分鲜明。给定真实数据...
2019-05-27 20:56:49
1290
原创 解决ValueError: Variable model/wpe already exists,reuse=True or reuse=tf.AUTO_REUSE in VarScope
训练gpt2时出现的问题,报错信息如下图所示:详细信息为:ValueError: Variable model/wpe already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope? Originally defined at:解决方法:每次训练前...
2019-05-27 15:20:43
2003
2
转载 Pytorch常用技巧
转载自https://www.pytorchtutorial.com/pytorch-goodies/ 本文总结了一些网上大家贡献的 PyTorch 编程技巧、常见代码等,包含模型统计数据、参数初始化、参数正则化等常用方法。如果你在 PyTorch 编程中刚好遇到这些问题,希望这篇总结能帮助到你。如果你有好的代码,欢迎在评论区分享给大家哦。文章目录[隐藏]1模型统计数据(...
2019-05-24 21:07:02
782
原创 Pytorch实现二分类器
以下我们用 PyTorch 实现一个很简单的二分类器,所用的数据来自 Scikit learn。首先来生成含200个样本的数据,并绘制出样本的散点图如下图所示:import matplotlib.pyplot as pltfrom sklearn.cluster import SpectralClusteringimport sklearn.datasetsX,y = sklea...
2019-05-24 20:40:41
28543
4
转载 Redis常用命令参考
转载自:https://kefeng.wang/2017/08/16/redis-command/Redis 命令可以直接在 Redis 命令行中执行,用于管理员维护服务器或开发人员维护数据。Redis 命令很庞杂,本文把它们按用途分类并进行了关键说明,便于对比记忆,也便于管理人员和开发人员有选择地查阅,也便于开发人员掌握第三方 Redis 开发包提供的接口。1 命令概述参考资料:...
2019-05-20 23:35:06
275
原创 FlyAI平台竞赛入门记录
FlyAI算法竞赛平台官方介绍如下:FlyAI是隶属于北京智能工场科技有限公司旗下,为AI开发者 (深度学习)提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,样例所使用开发框架涉及TensorFlow、Keras、PyTorch. 支持算法能力变现以及快速的迭代算法模型。挑战者,都在FlyAI!四大特点:1. 高质量的数据集、多领域的开源项目案例...
2019-05-06 11:26:13
4457
原创 Flutter中模拟器无法启动的解决方法
执行命令flutter emulators --launch Pixel2后报错如下:Failed to launch emulator: RegGetValueW failed 2 绯荤粺鎵句笉鍒版寚瀹氱殑鏂囦欢銆? emulator: ERROR: x86 emulation currently requires hardware acceleration! Please e...
2019-05-05 20:15:03
16115
原创 词向量 — word2vec
自然语言是一套用来表达含义的复杂系统。在这套系统中,词是表义的基本单元。在机器学习中,如何使用向量表示词?顾名思义,词向量是用来表示词的向量,通常也被认为是词的特征向量。近年来,词向量已逐渐成为自然语言处理的基础知识。为何不采用one-hot向量我们在循环神经网络中介绍过one-hot向量来表示词。假设词典中不同词的数量为NN,每个词可以和从0到N−1N−1的连续整数一一...
2019-04-09 22:47:50
703
原创 pytorch 1.1.0升级
Pytorch 1.1.0Pytorch 1.1.0于2019-05-01发布,详情见https://github.com/pytorch/pytorch/releases/tag/v1.1.0注: 不再支持CUDA8.0概述:官方TensorBoard支持,属性,字典,列表和JIT / TorchScript中用户自定义的类型,改进了分布式Highlights:TensorB...
2019-04-09 22:45:41
17139
1
原创 bert-embedding 安装及使用入门
安装pip install bert-embedding#如果要使用GPUpip install mxnet-cu92 Note:1. 安装过程中如果遇到WinError 5的权限问题,需要添加--user参数,即pip install --user mxnet-cu922. 若要支持cuda10.0需使用命令 pip install mxnet-cu100安装3. 验证...
2019-03-28 22:21:00
9037
6
原创 WinError 解决方法汇总
WinError 2 文件找不到解决方法:下载Microsoft Visual C++ 14.0安装包,再重新pip install torch_geometric, torch_scatter等WinError 5 拒绝访问 解决方法:由权限问题引起的,加上参数--user, 即重新输入命令 pip install --user spacy可成功安装spacyW...
2019-03-28 19:38:00
7786
转载 Java垃圾回收机制
转载自https://blog.youkuaiyun.com/zsuguangh/article/details/64295921. 垃圾回收的意义 在C++中,对象所占的内存在程序结束运行之前一直被占用,在明确释放之前不能分配给其它对象;而在Java中,当没有对象引用指向原先分配给某个对象的内存时,该内存便成为垃圾。JVM的一个系统级线程会自动释放该内存块。垃圾回收意味着程序不再需要的对象是"无用...
2019-03-22 11:13:52
242
原创 BFPRT算法
经典算法----BFPRT算法。1973 年, Blum 、 Floyd 、 Pratt 、 Rivest 、 Tarjan 集体出动,合写了一篇题为 “Time bounds for selection” 的论文,给出了一种在数组中选出第 k 大元素的算法,俗称"中位数之中位数算法"。依靠一种精心设计的 pivot 选取方法,该算法从理论上保证了最坏情形下的线性时间复杂度,打败了平均线性、最...
2019-03-21 13:12:37
419
原创 全卷积网络FCN---Gluon
全卷积网络(fully convolutional network,FCN)采用卷积神经网络实现了从图像像素到像素类别的变换 。与之前介绍的卷积神经网络有所不同,全卷积网络通过转置卷积(transposed convolution)层将中间层特征图的高和宽变换回输入图像的尺寸,从而令预测结果与输入图像在空间维(高和宽)上一一对应:给定空间维上的位置,通道维的输出即该位置对应像素的类别...
2019-03-20 18:13:56
1025
4
stanford-segmenter-2018-10-16.zip
2020-05-07
stanford-corenlp-full-2018-10-05.zip
2020-05-07
Active noise control a tutorial review.pdf
2020-05-07
cuda_10.0.130_windows_network.exe
2020-04-10
stanford-openie-models.jar
2020-04-10
stanford-postagger-full-2018-10-16.zip
2019-07-23
stanford-ner-2018-10-16.zip
2019-07-23
stanford-classifier-2018-10-16.zip
2019-07-23
Java并发编程
2017-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人