本文来自蓝衫科技和阿里云团队的对话:
1 阿里对外提供产品的方式有哪些?
- 包含了 7B 的开源模型,如通用模型Qwen-7B、对话模型Qwen-7B-Chat等,开发者可以在这个基础上进行二次开发,实现个性化功能
- 没有微调,不具备向量库功能
通义大模型
- 具有向量库,可以接入企业文档,实现知识问答的功能
- 支持 sft,基于微调训练可以生成更加精美的模型,实现更加准确的标准问答。为二次开发提供了更加灵活的方式
2 阿里云平台背后的逻辑是什么?
- 阿里模型平台作为开发平台,大模型能根据输入信息,提供对应的文档API能够直接定位原文内容
- 用户通过手动上传或API 批量上传的方式向向量数据库发送文档,不支持Excel形式的上传
- 对于大型文档,如 10 兆的文档,单发并训练耗时约 20 秒,而其默认的并发数是三个,一旦上传成功,文档就可以立即生效
- 用户不仅可以使用大模型作为参考依据,快速进行微调,还可以依赖大模型进行深度的参数训练
3 如何提高客户数据安全性?
- 从内容特征、特征萃取、语义特征、统计特征几大角度出发,对结构化数据、非结构化数据、图片文件以及敏感数据进行处理分类分级为客户提供更加灵活、安全的网络环境
ii.独立的向量引擎
- 采用先进的分布式架构能够高效处理大规模的数据运算,同时保持高性能、稳定性和可靠性
iii.以敏感数据为中心的能力联动
- 应对高危风险进行检测操作,追溯泄露主体识别异常行为,针对泄露进行告警、止血,及时发现异常数据接口暴露
四、基于云原生架构的层次化防勒索预案
- 已知勒索病毒入侵检测使用诱饵捕获和行为分析拦截未知病毒,云端定期备份以实时文件恢复
v. 各类网络业务全场景防护
- 利用 AI 技术智能判断数据爬取异常,精准识别虚假数据作弊以降低异常账号数据泄露风险,并避免数据接口被滥刷
4 阿里云的商业模式是什么?
- 注重数据质量控制。行业知识专家共同进行大规模的数据抽检、数据预处理和数据清洗工作专业人员进行审查和评测,以判断数据的质量
- 为行业服务商提供通用的基础能力和技术性训练。从而提供一体化解决方案,满足不同用户的需要
- 与服务商联合,以提供一体化解决方案。为特定行业或特定类型的客户定制,从而满足不同用户的需求。
作者:刘程杰