基于自然语言处理和机器学习的产业用地性质的识别 |
| |
引用本文: | 史晟恺.基于自然语言处理和机器学习的产业用地性质的识别[J].科技资讯,2024(2):50-53. |
| |
作者姓名: | 史晟恺 |
| |
作者单位: | 上海市测绘院 |
| |
摘 要: | 在产业用地信息梳理的过程中,首先需要确定地块的底数,其中图斑所在土地的用地性质是关键信息。由于一些早期的纸质信息对相关信息的关键字缺少明确标识,所以只能花费很多人力和时间去阅读这些纸质内容或者扫描文件中的数据,最后进行人工判断、总结。现基于自然语言处理和机器学习,通过引入重要词权重构建改进型朴素贝叶斯模型,对需要的土地信息进行识别,并和实际正确的信息进行比较。结果表明:通过机器学习对字典的构建后,运用自然语言处理技术对产业用地关键信息识别的准确度和效率有较大提升。
|
关 键 词: | 图斑 用地性质 自然语言处理 机器学习 |
|
|