Access交流中心

北京 | 上海 | 天津 | 重庆 | 广州 | 深圳 | 珠海 | 汕头 | 佛山 | 中山 | 东莞 | 南京 | 苏州 | 无锡 | 常州 | 南通 | 扬州 | 徐州 | 杭州 | 温州 | 宁波 | 台州 | 福州 | 厦门 | 泉州 | 龙岩 | 合肥 | 芜湖 | 成都 | 遂宁 | 长沙 | 株洲 | 湘潭 | 武汉 | 南昌 | 济南 | 青岛 | 烟台 | 潍坊 | 淄博 | 济宁 | 太原 | 郑州 | 石家庄 | 保定 | 唐山 | 西安 | 大连 | 沈阳 | 长春 | 昆明 | 兰州 | 哈尔滨 | 佳木斯 | 南宁 | 桂林 | 海口 | 贵阳 | 西宁 | 乌鲁木齐 | 包头 |

求助:如何实现查找出不同记录中同一个字段内文字相似度达90%的功能

lp20091638  发表于:2017-04-24 23:26:59  
复制

如提,求助~

最近本人在开发一个小程序,程序中需要实现一个功能:即在一个数据表中,有几万条记录,这些记录中有两个字段是经常重复,但有时候由于不同人在录入时,由于名称较长,及录入人的粗心大意,会出现录入的名字有细微的差别之处,那这时需要我们将这些有细微差别但很相似的数据给提取出来,让使用者去判断这些信息是不是本应该一致的,然后选择更改与否,并重新录入。

具体如下图所示,比如,这次我来录入数据时,把本应该是“广州南沙新区明珠湾区起步区灵山岛尖区域城市开发与建设项目--灵山岛尖配套道路工程三标段(江灵南路西段)”工程名称中不小心多加了-,变成了“广州南沙新区明珠湾区起步区灵山岛尖区域城市开发与建设项目---灵山岛尖配套道路工程三标段(江灵南路西段)”,也就是说这两条记录中的这个字段中应完全一致的,可是由于疏忽大大意,造成有细微的区别。这时候我需要进行信息匹配查询,查询出这样的字段,再进行更改。但我实在不知道应该如何安排这样的代码或者SQL或者实现方法~

 

Top
lp20091638 发表于:2017-04-24 23:42:41
再比如说下面这个图中所示的,明显就是输入人的错误引起的问题,这样本来应该是相同的,结果被统计为不同的工程名称,现在我就是想这样:查找出不同记录的同一字段的文字如果有80%的文字都相同,那么这两条记录中的工程名称就应该是同一个工程名称,并发出提示。


仙来 发表于:2017-04-25 10:08:23
用模糊查询

starnew 发表于:2017-04-29 21:31:46
这个好像不规范,应该是用代码来代替中文,如果用中文,可以在输入的同时引来原有的项目名称来进行比较

总记录:3篇  页次:1/1 9 1 :