字符串搜索算法

✍ dations ◷ 2025-11-25 21:58:49 #字符串匹配算法

字符串搜索算法(String searching algorithms)又称字符串比对算法(string matching algorithms)是一种搜索算法,是字符串算法中的一类,用以试图在一长字符串或文章中,找出其是否包含某一个或多个字符串,以及其位置。

最直观的解法是比对,如下例中,在字符串haystack中找出字符串needle

char* haystack;char* needle;int hlen, nlen, found;int i,j,k;found = 0;hlen = strlen(haystack);nlen = strlen(needle);for (i = 0; i < hlen; ++i) {    for (j = 0; j < nlen; ++j) {        if (haystack != needle) break;        if (j == nlen - 1) found = 1;    };};return found;

上例中,若字符串needle存在于字符串haystack中,则传回1,否则传回0。

但是此直观算法的复杂度为 O(mn),其中haystack的长度为n、needle的长度为m,所以另有更快速的算法。

令 为模式的长度, 为要搜索的字符串长度, 为字母表长度。

相关

  • 回避型人格障碍回避性人格障碍(英语: Avoidant Personality Disorder; 简称AvPD或APD),或译畏避型人格障碍、逃避型人格障碍、畏惧型人格违常,属于人格障碍的一种。因为害怕在别人面前丢脸,此类
  • 周围血管疾病周边动脉疾病(Peripheral artery disease, PAD),可以称为周边血管疾病(Peripheral vascular disease, PVD)、周边动脉阻塞性疾病(Peripheral artery occlusive disease, PAOD),或是
  • PRAM相变化存储器(英语:Phase-change memory,英语:Ovonic Unified Memory,英语:Chalcogenide RAM,简称PCM, PRAM, PCRAM, CRAM),又译为相变位存储器,是一种非易失性存储器设备。PRAM使用含
  • 丹麦克朗丹麦克朗(丹麦语:Danske kroner,货币符号:kr; 代码:DKK)是丹麦及其属地格陵兰的法定货币,而另一属地法罗群岛则使用丹麦克朗和法罗克朗两种货币。法罗克朗币值与丹麦克朗相同,可在法
  • 上海机器织布局机器织布局为中国第一家机器棉纺织工厂,于1878年由四川候补道彭汝琮主持筹建,1880年,郑观应接手。1883年,上海金融风潮后,郑观应离局。1890年,开始投产。投产后,织布局营业兴旺,由于
  • 高雄市交响乐团高雄市交响乐团 (Kaohsiung Symphony Orchestra;简称高市交、KSO)是高雄市政府以基金会形式所管理的交响乐团。附设于财团法人高雄市爱乐文化艺术基金会。总部位于高雄市凤山
  • 板桥坐标:25°00′35″N 121°27′33″E / 25.0096703°N 121.4590989°E / 25.0096703; 121.4590989板桥区(台湾话: Pang-kiô-khu;客家话: Piông-khièu-khî;旧称枋桥、摆接)为台湾
  • 火积云火积云(flammagenitus、pyrocumulus或fire cloud)是一种相当浓厚的积云,常伴随火山或山火等高温环境中形成。火积云在动力学上与火灾旋风有一些类似之处,而这两个现象可能会一起
  • 十三行广州十三行(英语:Thirteen Factories或Thirteen Hongs of Canton),又称广东十三行、十三洋行,是指清朝沿用明朝之习惯称呼广州对外贸易特区内的十三家牙行商人。后来,这地区称为“
  • 美国东部时间北美东部时区(North American Eastern Time Zone),或称美国东部时间(The Eastern Time Zone,ET),主要包括北美东海岸和南美西海岸,其标准时间(EST)为UTC-5,夏令时间(EDT)为UTC-4。此外,以