V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
pysex
V2EX  ›  Elasticsearch

100G 8000 万条信息全文检索, Elasticsearch 是最优选择吗?

  •  
  •   pysex · 2022 年 11 月 17 日 · 2968 次点击
    这是一个创建于 1150 天前的主题,其中的信息可能已经有所发展或是发生改变。

    数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
    还是数据做双写

    5 条回复    2023-06-02 12:32:40 +08:00
    huangqihong
        1
    huangqihong  
       2022 年 11 月 17 日
    咦,我好像在掘金看到了的
    bjzhush
        2
    bjzhush  
       2022 年 11 月 17 日
    你没写数据的增长速度,搜索的复杂度的支持,索引的实时程度的要求,查询结果返回时间的需求,还有用户量和查询量,对弹性扩容的需求,这些都需要考虑的
    很多年没做搜索了,ES 是比较出名的,但是貌似机器的消耗也比较多
    搜索方案很多的,测试起来也很快,都可以考虑考虑
    2013 年我曾经单机 sphinx 索引过 10 亿以上数据,响应还不慢,不过需求特殊,单机版就够用哈哈哈
    pysex
        3
    pysex  
    OP
       2022 年 11 月 18 日
    @bjzhush 那自己买一台 ECS 自建?单机的
    bjzhush
        4
    bjzhush  
       2022 年 11 月 18 日
    @pysex 当初是帮朋友做的,我自己本机的台式机,他拿过去用也是本机。场景不一样,那个是社工库
    bigtang
        5
    bigtang  
       2023 年 6 月 2 日
    单机不是最优选择,ES 优势在分布式上,可以参考一下 tanglib.com, 单机 800G 文本,可以做到 instant search 。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2261 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 01:27 · PVG 09:27 · LAX 17:27 · JFK 20:27
    ♥ Do have faith in what you're doing.