Django对接elasticsearch实现全文检索的示例代码

 更新时间:2021年08月02日 09:22:29   作者:劲风君  
搜索是很常用的功能,如果是千万级的数据应该怎么检索,本文主要介绍了Django对接elasticsearch实现全文检索的示例代码,感兴趣的可以了解一下

Python客栈送红包、纸质书

前言

说到搜索,第一时间想到的是mysql数据库的like语句

但是,假如你的数据库有几千万条数据,name字段没有索引,可能查询需要十几分钟,用户可能会等你?那为什么不给name字段增加索引?数据表不仅仅是用来查询,也会经常修改数据,新增删除数据等。建立索引后,做增删改操作时也会大大占用数据库资源。所以应该怎么解决呢?

Elasticsearch!

一个强大的基于Lucene的全文搜索服务器!维基百科、Stack Overflow、Github都在用。

如果想详细了解其原理的话,可以参考:https://www.elastic.co/guide/index.html

第一步:首先安装相关的依赖包

1
2
3
pip install drf-haystack
pip install elasticsearch
pip install djangorestframework

第二步:在django项目配置文件settings.py中注册应用

1
2
3
4
5
6
INSTALLED_APPS =
[
'app.apps.AppConfig',
'haystack',
'rest_framework'
]

第三步:在django项目配置文件settings.py中指定搜索的后端

1
2
3
4
5
6
7
8
9
10
11
HAYSTACK_CONNECTIONS = {
'default':    {
            'ENGINE':'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',
            'URL': 'http://127.0.0.1:9200/', # 此处为elasticsearch运行的服务器ip地址,端口号固定为9200
            'INDEX_NAME': 'test', # 指定elasticsearch建立的索引库的名称
            },
            }
# 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
# 指定搜索结果每页的条数
# HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

第四步:创建索引类

在此之前要先创建model类,并插入数据

1
2
3
4
from django.db import models
class Es(models.Model):
    name=models.CharField(max_length=32)
    desc=models.CharField(max_length=32)

在需要进行索引的应用的目录下创建文件search_indexes.py, 在该文件内创建该索引类
我在app应用下创建:search_indexes.py

1
2
3
4
5
6
7
8
9
10
11
# 索引模型类的名称必须是 模型类名称 + Index
from haystack import indexes
from .models import Es
class EsIndex(indexes.SearchIndex, indexes.Indexable):
    text = indexes.CharField(document=True, use_template=True)
    def get_model(self):
    """返回建立索引的模型类"""
        return Es
    def index_queryset(self, using=None):
    """返回要建立索引的数据查询集"""
        return self.get_model().objects.all()

第五步:在templates目录中创建text字段使用的模板文件

创建文件templates/search/indexes/app/es_text.txt文件中定义

1
2
{{ object.name }}
{{ object.desc }}

第六步:手动更新索引

1
python manage.py rebuild_index   #数据库有多少条数据,全部会被同步到es中

第七步:创建haystack序列化器

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from drf_haystack.serializers
import HaystackSerializer
from rest_framework.serializers
import ModelSerializer from app
import models
from app.search_indexes import EsIndex
class EsSerializer(ModelSerializer):
    class Meta:
        model=models.Es
        fields='__all__'
class EsIndexSerializer(HaystackSerializer):
     object = EsSerializer(read_only=True) # 只读,不可以进行反序列化
     class Meta:
        index_classes = [EsIndex]# 索引类的名称
        fields = ('text', 'object')# text 由索引类进行返回, object 由序列化类进行返回,第一个参数必须是text

第八步:创建视图类

1
2
3
4
5
6
7
from drf_haystack.viewsets
import HaystackViewSet
from app.models import Book
from app.serializers import EsIndexSerializer
class EsSearchView(HaystackViewSet):
    index_models = [Es]
    serializer_class = EsIndexSerializer

第九步:添加路由

1
2
3
4
5
6
7
8
9
from django.conf.urls
import url from django.contrib
import admin
from rest_framework import routers
from app.views import EsSearchView
    router = routers.DefaultRouter()
    router.register("book/search", EsSearchView, base_name="book-search")
    urlpatterns = [ url(r'^admin/', admin.site.urls), ]
    urlpatterns += router.urls

第十步:结果

http://127.0.0.1:8000/?text=测试

到此这篇关于Django对接elasticsearch实现全文检索的示例代码的文章就介绍到这了,更多相关Django elasticsearch实现全文检索内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

蓄力AI

微信公众号搜索 “ 脚本之家 ” ,选择关注

程序猿的那些事、送书等活动等着你

原文链接:https://juejin.cn/post/6991354297728368648

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 reterry123@163.com 进行投诉反馈,一经查实,立即处理!

相关文章

  • 深入掌握Python模块创建导入和使用

    深入掌握Python模块创建导入和使用

    这篇文章主要为大家介绍了深入掌握Python模块创建导入和使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-10-10
  • Python合并2个字典成1个新字典的方法(9种)

    Python合并2个字典成1个新字典的方法(9种)

    这篇文章主要介绍了Python合并2个字典成1个新字典的方法,本文通过实例代码给大家分享9中方法,需要的朋友可以参考下
    2019-12-12
  • python 输出一个两行字符的变量

    python 输出一个两行字符的变量

    昨天被一个哥们问怎么用 python输出一个两行字符的变量。写了N个方法都觉得麻烦。
    2009-02-02
  • TensorFlow隐藏操作探索(张量操作和定制模型算法)

    TensorFlow隐藏操作探索(张量操作和定制模型算法)

    这篇文章主要为大家介绍了TensorFlow隐藏操作探索(张量操作和定制模型算法),有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11
  • Python多线程扫描端口代码示例

    Python多线程扫描端口代码示例

    这篇文章主要介绍了Python多线程扫描端口代码示例,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-02-02
  • 详解sklearn Preprocessing 数据预处理功能

    详解sklearn Preprocessing 数据预处理功能

    这篇文章主要介绍了sklearn Preprocessing 数据预处理功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-08-08
  • Python使用matplotlib绘制多个图形单独显示的方法示例

    Python使用matplotlib绘制多个图形单独显示的方法示例

    这篇文章主要介绍了Python使用matplotlib绘制多个图形单独显示的方法,结合实例形式分析了matplotlib实现绘制多个图形单独显示的具体操作技巧与注意事项,代码备有较为详尽的注释便于理解,需要的朋友可以参考下
    2018-03-03
  • python实现的分层随机抽样案例

    python实现的分层随机抽样案例

    这篇文章主要介绍了python实现的分层随机抽样案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python + selenium自动化环境搭建的完整步骤

    Python + selenium自动化环境搭建的完整步骤

    这篇文章主要给大家介绍了关于Python + selenium自动化环境搭建的相关资料,文中通过图文将实现的步骤一步步介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起看看吧
    2018-05-05
  • python多进程提取处理大量文本的关键词方法

    python多进程提取处理大量文本的关键词方法

    今天小编就为大家分享一篇python多进程提取处理大量文本的关键词方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06

最新评论