用C语言做模糊搜索

2018 年 8 月 14 日 程序人生

点击上方“程序人生”,选择“置顶公众号”

第一时间关注程序猿(媛)身边的故事


作者

De掉所有bug

文末「阅读原文」查看原文出处。

如需转载,请联系原作者授权。


绪论:本文所提到的模糊搜索是指输入不完整的关键词即可查询到对应的全部准确结果。

例如:输入“天”即可将所有姓名中带有“天”字的人搜索出来;输入“0809”即可将所有ID中带有“0809”片段的人搜索出来。

这种搜索技术被广泛应用于各大有查询功能的软件,为用户提供了极大的方便。在众多的QQ/微信好友中,输入想要查找的联系人的姓名的一部分即可查找到该联系人,是不是很方便呢?在excel中,即使只记住了查询对象的几个字,也能够通过这种查找方式查询到对应的对象,是不是弥补了你的健忘症呢?

实现模糊搜索算法的思路:输入的关键词即为一个字符数组(字符串),本文将以"abcdef"这个字符串为例。要想完成对片段的查询,不能仅仅从前往后比对,也不能仅仅从后往前比对,而是要将所有的片段都进行一遍比对。这就要求要将字符串的所有连续子片段都找出来存放到一个新的线性结构中,通过对新线性结构的遍历并使用字符串比较函数strcmp进行模糊搜索。

那么"abcdef"这个字符串到底有多少个连续子片段呢?我们按照子片段的长度挨个找规律,按长度由大到小进行:长度为6的就只有"abcdef"这1个;长度为5的有2个:"abcde"和"bcdef";长度为4的有3个:"abcd"、"bcde"和"cdef";长度为3的有4个;长度为2的有5个;长度为1的有6个。所以一共有1+2+3+4+5+6=21个。想必看到这里大家已经找到了规律:若关键词的长度为n,则该关键词的连续子字符串的个数就为1+2+3+...+n。

以下函数用作判断是否符合筛选条件,其中key为关键词。

//模糊搜索判断是否符合筛选条件
int result_mohu(const gchar* key,char* str)
{
   typedef struct
   {

       char son[11];
   }Element;

   int i,j,k=0,l=0,m=0;

   //f=1为符合筛选条件
   int f=0;

 //N1为str的长度 N2为str连续子串的个数
 int N1=0,N2=0;
 N1=strlen(str);
 /*计算连续子串的个数*/
 for(i=1;i<=N1;i++)
   N2+=i;

   /*计算连续子串的个数*/
   //i控制子字符串的长度
   //j控制赋值
   //k控制新的线性结构b的下标
   //l控制子数组的首项在原数组中的位置
   //m控制即将用作赋值的str的下标
   Element *b=malloc(sizeof(Element)*N2);
   for(i=1;i<=N1;i++)
   {
       l=0;
       /*while循环内为给一个子字符串数组赋值*/
       while(1)
           {
           m=l;
           for(j=0;j<i;j++)
           {
               b[k].son[j]=str[m];
               m++;
           }
           l++;
           k++;
           if(m==N1)
               break;
           }
   }

   //挨个比对
   for(i=0;i<N2;i++)
       if(strcmp(key,b[i].son)==0)
       {
            f=1;
            break;
       }
   free(b);
   return f;
}


若返回值f=1则表示符合筛选条件,即查询对象含有包含关键词的片段。最为关键的循环就是按照子字符串的长度从1到N1(查询对象字符串的长度)。 

以下片段为遍历代码,可看可不看,核心算法都在上面。注:博主实现模糊搜索的环境是linux系统下的gtk开发。

//按学号查找界面的<查找>
void on_button_idsearch_clicked(GtkObject* widget,gpointer user_data)
{
 int i;
 int f=0;
 GtkTreeIter iter;
 //获取搜索关键字
 const gchar* keywords = gtk_entry_get_text(entry_search_id);
 gtk_list_store_clear(liststore2);

 for(i=0;i<size1;i++)
   if(result_mohu(keywords,stu1[i].id)==1)
     {        
       gtk_list_store_append(liststore2,&iter);
       gtk_list_store_set(liststore2,&iter,0,stu1[i].no,-1);
       gtk_list_store_set(liststore2,&iter,1,stu1[i].id,-1);
       gtk_list_store_set(liststore2,&iter,2,stu1[i].name,-1);
       gtk_list_store_set(liststore2,&iter,3,stu1[i].math,-1);
       gtk_list_store_set(liststore2,&iter,4,stu1[i].c_language,-1);
       gtk_list_store_set(liststore2,&iter,5,stu1[i].daolun,-1);
       gtk_list_store_set(liststore2,&iter,6,stu1[i].english,-1);
       gtk_list_store_set(liststore2,&iter,7,stu1[i].pe,-1);
       gtk_list_store_set(liststore2,&iter,8,stu1[i].history,-1);
       gtk_list_store_set(liststore2,&iter,9,stu1[i].daoyuan,-1);
       gtk_list_store_set(liststore2,&iter,10,stu1[i].banzhuren,-1);
       gtk_list_store_set(liststore2,&iter,11,stu1[i].score_classmate,-1);
       gtk_list_store_set(liststore2,&iter,12,stu1[i].sum,-1);
       f=1;
     }
 if(f==0)
   gtk_widget_show(GTK_WIDGET(window_noresult));
}

最后给大家看一下实验结果:

大家如果有什么疑问欢迎email作者本人,想要本文做的这个系统的成品的可以在email里回复“我要成品”。作者email地址:freedom11235@126.com


- The End -

「若你有原创文章想与大家分享,欢迎投稿。」

加编辑微信ID,备注#投稿#:

程序 丨 druidlost  

小七 丨 duoshangshuang

上期精彩内容

登录查看更多
0

相关内容

互联网
【电子书】Flutter实战305页PDF免费下载
专知会员服务
22+阅读 · 2019年11月7日
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
图像主题色提取算法
算法与数学之美
4+阅读 · 2018年9月1日
一个强化学习 Q-learning 算法的简明教程
数据挖掘入门与实战
9+阅读 · 2018年3月18日
机器学习面试题精讲(一)
七月在线实验室
4+阅读 · 2018年1月11日
【关关的刷题日记60】Leetcode 437. Path Sum III
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
代码这样写不止于优雅(Python版)
数说工作室
4+阅读 · 2017年7月17日
Parsimonious Bayesian deep networks
Arxiv
5+阅读 · 2018年10月17日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
7+阅读 · 2018年3月21日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关资讯
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
图像主题色提取算法
算法与数学之美
4+阅读 · 2018年9月1日
一个强化学习 Q-learning 算法的简明教程
数据挖掘入门与实战
9+阅读 · 2018年3月18日
机器学习面试题精讲(一)
七月在线实验室
4+阅读 · 2018年1月11日
【关关的刷题日记60】Leetcode 437. Path Sum III
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
代码这样写不止于优雅(Python版)
数说工作室
4+阅读 · 2017年7月17日
相关论文
Top
微信扫码咨询专知VIP会员