阿里+数据安全? | 蓝衫科技对话阿里云团队

本文来自蓝衫科技和阿里云团队的对话:

1 阿里对外提供产品的方式有哪些?

模型服务平台
  • 包含了7B的开源模型,如通用模型Qwen-7B、对话模型Qwen-7B-Chat等,开发者可以在这个基础上进行二次开发,实现个性化功能
  • 没有微调,不具备向量库功能

通义大模型

  • 具有向量库,可以接入企业文档,实现知识问答的功能
  • 支持SFT,基于微调训练可以生成更加精美的模型,实现更加准确的标准问答。为二次开发提供了更加灵活的方式

2 阿里云平台背后的逻辑是什么?

  • 阿里模型平台作为开发平台,大模型能根据输入信息,提供对应的文档,API能够直接定位原文内容
  • 用户通过手动上传API批量上传的方式向向量数据库发送文档,不支持Excel形式的上传
  • 对于大型文档,如10兆的文档,单并发训练耗时约20秒,而其默认的并发数是三个,一旦上传成功,文档就可以立刻生效
  • 用户不仅可以使用大模型作为参考依据,快速进行微调,还可以依赖大模型进行深度的参数训练

3 如何提高客户数据安全性?

i. 虚拟私有云划分

  • 从内容特征、特征萃取、语义特征、统计特征几大角度出发,对结构化数据、非结构数据、图片文件以及敏感数据进行分类分级,为客户提供更加灵活、安全的网络环境

ii. 独立的向量引擎

  • 采用先进的分布式架构,能够高效处理大规模的数据运算,同时保持高性能、稳定性和可靠性

iii.以敏感数据为中心的能力联动

  • 应对高危风险进行操作检测追溯泄露主体,识别异常行为,针对泄露进行告警、止血,及时发现异常数据接口暴露

iv.基于云原生架构的层次化防勒索预案

  • 已知勒索病毒入侵检测,使用诱饵捕获行为分析,拦截新型未知病毒,云端定期备份以实时文件恢复

v.各类Web业务全场景防护

  • 利用AI技术智能判断数据爬取异常精准识别虚假数据作弊以降低异常账号数据泄露风险,并避免数据接口被滥刷

4 阿里云的商业模式是什么?

“以AI算力Maas平台为核心,通过提供包括模型训练、微调、部署及推理等在内的一整套工具链和服务,成为‘AI时代最开发的云’。”

  • 注重数据质量控制。行业知识专家共同进行大规模的数据抽检数据预处理数据清洗工作。专业人员进行审查和评测,以判断数据的质量
  • 为行业服务商提供通用的基础能力和技术性训练。从而提供一体化解决方案,满足不同用户的需要
  • 与服务商联合,以提供一体化解决方案。为特定行业或特定类型的客户定制,从而满足不同用户的需求。比如,阿里云可以帮助零售业进行大规模数据分析,以最大程度地提升销售效率;又比如,阿里云可以帮助金融机构进行风险控制和反欺诈,以最大程度地保障数据安全
                                      

作者:刘程杰

订阅
通知
0 评论
内联反馈
查看所有评论
en_US
Scroll to Top