haozi23333
V2EX  ›  外包

请各位推荐一下,有没有什么速度快支持语言多的翻译模型

  •  1
     
  •   haozi23333 · May 12, 2024 · 1794 views
    This topic created in 760 days ago, the information mentioned may be changed or developed.

    我现在用的是, https://huggingface.co/google/madlad400-3b-mt 一个量化之后的模型, A5000/RTX4090 可以跑到 90token/s 单任务的速度

    例子代码来自 https://github.com/huggingface/candle/blob/main/candle-examples/examples/quantized-t5/main.rs

    有没有速度比这个再快点的模型(要尽可能支持主流语言), 或者可以优化执行速度(付费支持, 如果能达到单任务 200~300token/s A5000 的卡, 200$起).

    tg 可以直接联系我 @chino23333 微信的话您留我联系您 (国内下午 4 点后在线

    1 replies    2024-05-13 15:34:23 +08:00
    csulyb
        1
    csulyb  
       May 13, 2024
    我也想知道
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1323 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 17:22 · PVG 01:22 · LAX 10:22 · JFK 13:22
    ♥ Do have faith in what you're doing.