在讲课程《数据结构和算法》的过程中,我给了学生们一个参考例程,希望他们能够从程序中学到词频统计的方法。由于同学们底子比较薄弱,所以给出程序后,我希望同学们能够认真的查阅程序中用到的每个函数,了解其用法,这样才能真正的搞懂程序,遗憾的是我的学生只是完成了实验报告,而程序中很多函数的用法和含义根本就没搞清楚。这种学法是应付式的学法,我极不赞成这样的学习方式。所以才会有了此系列文章。也许是底子弱,也许是不爱学。
面对学生不爱学或者说学习不刻苦的状况,我也只能把这些好的代码传播到网上,让更多人能够借力学习。这也是我现在会更加专注网络传播文章的原因吧。有了词频统计程序,我们就可以在这个基础之上进行扩展,写出更复杂的程序。我就用这样的事例来写出了一个完整的系列文章,告诉大家如何从基础学起,然后再逐步的完善和深入,写出功能更强大的程序,这样的过程走一遍,才算是真正的掌握知识,才能把别人的知识转化为属于自己的知识。写这个系列耗时一个多月,大家看文章花了多长时间呢?有了阶梯,希望大家能好好利用和珍惜。
文本分析对于通信工程专业的学生而言,只是牛刀小试,等到完成词频统计的算法后大家还可以沿这条路继续深入,比如进行语音信号的识别。先进行信号中数字的识别,再进行语义识别。这些可比字符的识别难多了。当下,文本信息已经退居次席,人们更多在意的是语音和视频。因此,语音信号和视频信号处理是当下的技术热点,让我们一起由浅入深的学习吧。本课题可以作为毕业设计的题目,可以根据个人能力适当增加难度。
词频统计主要分为英文词频统计和中文词频统计。英文词频统计很简单,可以借助MATLAB自带函数进行断句,然后再进行统计即可。中文词频统计相对复杂一些。关键在于如何使用合适的语料库和如何精准匹配词语。比如句中出现了“人工智能”四字词,我们应该这四个字视为一个词,而不能分析成为两个词。再者出现生僻词语怎么办?慢慢来,我们先从简单的学起。依旧是老规矩,先看代码!代码中的注释非常清晰,当看完程序后也就明了了。
原文标题:大学毕业设计一席谈之四十八 词频统计(1)
文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
原文标题:大学毕业设计一席谈之四十八 词频统计(1)
文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。
相关推荐
一、设计简介本毕业设计项目是基于STM32单片机的物联网机智云智能家居系统,包含原理图PCB手机APP。智能家居系统以STM32C8T6单片机为核心,结合多种传感器和执行器,通过ESP8266实现
发表于 11-30 01:03
•662次阅读
NVIDIA 创始人兼首席执行官黄仁勋在香港科技大学获得工程学荣誉博士学位。黄仁勋在现场发表演讲并与香港科技大学校董会主席沈向洋教授展开了炉边对话。
发表于 11-25 15:05
•349次阅读
第四十八章 自学习分类实验
在上一章节中,介绍了利用maix.KPU模块实现了MNIST的手写数据识别,本章将继续介绍利用maix.KPU模块实现的自学习分类。通过本章的学习,读者将学习到自学习分类
发表于 11-20 09:22
第16章-超声波跟随功能 基于STM32的三路超声波自动跟随小车 毕业设计 课程设计
发表于 08-21 15:26
•499次阅读
近日,福禄克公司计量校准部首席电磁计量师杨胜利老师及多位电学技术支持老师们一行,受邀前往北京交通大学自动化系。在这里,他们与大四的本科生、研究生和博士生们共同开启了一场意义非凡、别开生面的毕业
发表于 08-16 10:36
•522次阅读
6月7日,浙江大学机械工程学院2024年“思看杯”本科毕业设计展在浙江大学紫金港校区机器人与智能装备学生创新实践基地顺利召开,吸引了线上线下近千人的参与。 思看科技为本次毕业展提供了多
发表于 06-14 15:35
•514次阅读
2024年第四十八届中国电工仪器仪表产业发展技术研讨暨展会,于2024年4月在杭州白金汉爵大酒店成功举办,众多电工仪器仪表行业的领先企业和专业人士参与,展示最新的产品、技术和解决方案,探讨行业发展趋势和市场机遇。
发表于 05-15 14:42
•799次阅读
上海矽朋微电子第四十八届中国电工仪器仪表展展会回顾01现场盛况2024年4月9~10日,第四十八届中国电工仪器仪表产业发展技术研讨会及展会在产业链上下游热切期盼中于杭州盛大召开。来自电网公司、计量
发表于 04-12 08:25
•275次阅读
4月9-10日,第四十八届中国电工仪器仪表产业发展技术研讨会暨展会(以下简称“电力展”)在杭州举行,立足于行业发展战略和市场需求,着眼于新产品应用与技术,电力展以二十多年的成功运营经验为依托,连接电工仪器仪表行业上下游,已发展成为行业最具规模和影响力的展会之一。
发表于 04-11 14:27
•591次阅读
4月9-10日,第四十八届中国电工仪器仪表产业发展技术研讨会暨展会于杭州顺利举办,现场汇聚电力终端企业、电网公司、计量检测机构、科研院所及各行业企业代表。在“双碳”目标下,广和通聚焦智能电网发展,携多款高性能4G/5G模组、RedCap模组及智慧电网解决方案亮相T22-T23展位。
发表于 04-10 10:08
•432次阅读
4月9-10日,第四十八届中国电工仪器仪表产业发展技术研讨会暨展会于杭州顺利举办,现场汇聚电力终端企业、电网公司、计量检测机构、科研院所及各行业企业代表。在“双碳”目标下,广和通聚焦智能电网发展,携多款高性能4G/5G模组、RedCap模组及智慧电网解决方案亮相T22-T23展位。
发表于 04-10 10:08
•450次阅读
4月9-10日,第四十八届中国电工仪器仪表产业发展技术研讨会暨展会于杭州顺利举办,现场汇聚电力终端企业、电网公司、计量检测机构、科研院所及各行业企业代表。
发表于 04-10 09:31
•320次阅读
华强北衰败的原因是什么,一个主要原因是,几十个各式各样的专业市场在激烈的竞争时,没有变革和迭代而衰败了,当然背后还有支撑他们的产业链和生态链也是如此。比如太平洋安防市场原来生意很旺,安防市场是由
发表于 01-23 14:49
宋仕强论道之华强北的专业市场(四十八):
华强北衰败的原因是什么,一个主要原因是,几十个各式各样的专业市场在激烈的竞争时,没有变革和迭代而衰败了,当然背后还有支撑他们的产业链和生态链也是如此。比如
发表于 01-23 09:51
先来看看改动的程序!每个部分都有相应的说明和介绍。这是程序最终的运行结果!
发表于 01-13 09:39
•448次阅读
评论