MongoEngine - 文本搜索

MongoDB 支持使用可以对字符串内容执行文本搜索的查询运算符。 如前所述,用 $ 符号设置索引的文本索引前缀名称。 对于文本索引,索引字段的权重表示该字段相对于其他索引字段在文本搜索得分方面的重要性。 您还可以在类的元字典中指定默认语言。

可在 https://docs.mongodb.com/manual/reference/text-search-languages/ 找到支持的语言列表 MongoEngine API 由用于 QuerySet 对象的 search_text() 方法组成。 要在索引字段中搜索的字符串作为参数给出。

在下面的示例中,我们首先定义了一个名为 lang 的文档类,其中包含两个字符串字段,即语言名称及其特征。 我们还在两个字段上创建具有各自权重的索引。

from mongoengine import *
con=connect('newdb')

class lang (Document):
   name=StringField()
   features=StringField()
   meta = {'indexes': [
      {'fields': ['$name', "$features"],
         'default_language': 'english',
         'weights': {'name': 2, 'features': 10}
      }]
   }

l1=lang()
l1.name='C++'
l1.features='Object oriented language for OS development'
l1.save()
l2=lang()
l2.name='Python'
l2.features='dynamically typed and object oriented for data science, AI and ML'
l2.save()
l3=lang()
l3.name='HTML'
l3.features='scripting language for web page development'
l3.save()

为了搜索单词"oriented",我们使用 search_text() 方法如下 −

docs=lang.objects.search_text('oriented')
for doc in docs:
   print (doc.name)

上述代码的输出将是语言的名称,其描述中出现了"oriented"一词(在本例中为"Python 和"C++)。