目前系统采用的是通义千问开源视觉理解大模型Qwen-VL
于2023年12月1日发布重大更新,不仅大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。
升级的Qwen-VL(qwen-vl-plus/qwen-vl-max)模型现有几大特点:
‒ 大幅增强了图片中文字处理能力,能够成为生产力小帮手,提取、整理、总结文字信息不在话下。
‒ 增加可处理分辨率范围,各分辨率和长宽比的图都能处理,大图和长图能看清。
‒ 增强视觉推理和决策能力,适于搭建视觉Agent,让大模型Agent的想象力进一步扩展。
‒ 升级看图做题能力,拍一拍习题图发给Qwen-VL,大模型能帮用户一步步解题。
![](https://img.kancloud.cn/bb/d5/bbd52af1fb53fcc9913e28e224ab05c1_600x1055.png)
- 系统介绍
- Ai问答
- 应用工具箱
- 提示词编排
- 实时联网
- 按时间收费
- 按次数收费
- 公众号菜单配置
- 新用户赠送次数
- 充值提示配置
- 分销配置
- 修改后台密码
- 卡密会员
- 接入私有知识库
- Ai文档(PDF解析)
- Ai语音(口语陪练)
- 绘画配置
- 图生图
- 文生图
- 图片内容识别
- Ai修图
- 微信支付
- 开放接口
- 销售机器人
- 智能客服
- 微信群
- 工作流
- 支持模型
- 文心一言
- 通义千问
- 讯飞星火
- 智普清言
- 腾讯混元
- 零一万物Yi
- 视觉模型
- openai
- moonshot(Kimi)
- 开源私有模型
- 豆包
- DeepSeek
- Dify
- 扣子Coze
- 豆包语音
- 支持平台
- 公众号
- 企业微信
- H5客服
- PC电脑端
- 基础功能
- PDF解析
- PC支付
- 微信小程序
- 抖音小程序
- 抖音私信
- 抖音粉丝群
- 钉钉
- 压力实测
- 联系方式
- 常见问题
- 项目合作
- 法律法规
- 私有化部署
- AI训练