|
5天前
|
搜索推荐 Python
|

探索Python中的推荐系统:内容推荐

探索Python中的推荐系统:内容推荐

54 1
|
5天前
|
自然语言处理 搜索推荐 算法
|

UniMS-RAG:用于个性化对话的统一多源RAG框架

RAG领域已经取得了相当大的发展,这篇论文的是如何分解RAG过程,加入多文件检索、记忆和个人信息等定制化的元素。

140 1
|
5天前
|
机器学习/深度学习 人工智能 算法
|

机器学习入门知识

机器学习入门知识

153 0
来自: 人工智能平台PAI  版块
|
5天前
|
机器学习/深度学习 存储 算法
|

OpenAI Gym 中级教程——强化学习实践项目

OpenAI Gym 中级教程——强化学习实践项目

63 1
|
5天前
|
数据采集 JSON 监控
|

Kotlin高效App爬取工具:利用HttpClient与代理服务器的技巧

Kotlin高效App爬取工具:利用HttpClient与代理服务器的技巧

24 2
|
5天前
|
数据采集 搜索推荐 API
|

京东商品评论数据采集接口python

京东商品评论数据采集接口python

41 0
|
5天前
|

abs() 函数:返回一个数的绝对值

abs() 函数:返回一个数的绝对值

22 0
|
5天前
|
消息中间件 安全 Kafka
|

一文搞懂Kafka中的listeners配置策略

1. listeners中的plaintext controller external是什么意思? 2. Kraft模式下controller和broker有何区别? 3. 集群节点之间同步什么数据,通过哪个端口,是否可以自定义端口? 4. 客户端通过哪个端口连接到kafka,通过9092连接的是什么,broker还是controller? 5. 为controller配置了单独的端口有什么用? 6. control.plane.listener.name与controller.listener.names有何区别?

279 2
|
5天前
|
机器学习/深度学习 分布式计算 算法
|

机器学习PAI常见问题之跑predict时报错如何解决

PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

357 3
来自: 人工智能平台PAI  版块
|
5天前
|
机器学习/深度学习 人工智能 DataWorks
|

机器学习PAI常见问题之self-attention再target-attention如何解决

PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

375 3
来自: 人工智能平台PAI  版块
|
5天前
|
机器学习/深度学习 自然语言处理 物联网
|

Chronos: 将时间序列作为一种语言进行学习

Chronos框架预训练时间序列模型,将序列值转为Transformer模型的tokens。通过缩放、量化处理,模型在合成及公共数据集上训练,参数量20M至710M不等。优于传统和深度学习模型,展示出色零样本预测性能。使用分类交叉熵损失,支持多模态输出分布学习。数据增强策略包括TSMix和KernelSynth。实验显示大型Chronos模型在概率和点预测上超越多种基线,且微调小型模型表现优异。虽然推理速度较慢,但其通用性简化了预测流程。论文探讨了优化潜力和未来研究方向。

78 3
|
5天前
|
机器学习/深度学习 SQL 存储
|

机器学习PAI常见问题之资源不足如何解决

PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

98 3
来自: 人工智能平台PAI  版块
|
5天前
|
监控 数据挖掘 API
|

案例研究:如何通过淘宝天猫商品销量数据分析竞争对手

淘宝天猫的商品销量数据接口主要用于商品数据分析和监控业务,通过这些接口可以获取商品的实时销量、30天销量以及总销量等详细信息。以下是关于这一数据接口的详细介绍:

29 1
|
5天前
|
数据挖掘
|

深入分析:ERP系统的优势与劣势

深入分析:ERP系统的优势与劣势

76 3
|
5天前
|
搜索推荐 算法 Python
|

探索Python中的推荐系统:协同过滤

探索Python中的推荐系统:协同过滤

66 0
|
5天前
|
JSON 数据挖掘 API
|

京东商品详情数据接口(app)Python

京东商品详情数据接口(app)Python

51 0
|
5天前
|
云安全 弹性计算 Linux
|

【新手教程】0基础1分钟搞定幻兽帕鲁游戏联机服务器搭建

幻兽帕鲁(Palworld)是一款备受欢迎的多人在线角色扮演游戏,让玩家可以与其他玩家一起探索、组队和战斗。为了能顺畅地体验游戏,搭建一个高效、稳定的游戏服务器至关重要。阿里云提供快速、简化的服务器搭建方案,新手小白0基础1分钟搞定幻兽帕鲁游戏联机服务器搭建!

47 0
|
5天前
|
SQL 消息中间件 算法
|

TuGraph Analytics图数据集成:表到图的最后一公里

小伙伴们想玩一玩图计算,数据的导入工作总是绕不开的一个环节。为了降低大家数据导入操作的成本,提升图计算的整体使用体验,TuGraph Analytics推出了“图数据集成”能力,帮助大家通过简单配置完成数据导入工作。

56 0
|
5天前
|
SQL 存储 数据处理
|

阿里云实时计算Flink的产品化思考与实践【上】

本文整理自阿里云高级产品专家黄鹏程和阿里云技术专家陈婧敏在 FFA 2023 平台建设专场中的分享。

3415 4
来自: 实时计算 Flink  版块
|
5天前
|
资源调度 供应链 监控
|

探索企业资源规划(ERP)系统的基本概念

探索企业资源规划(ERP)系统的基本概念

48 0
|
5天前
|
数据采集 API C#
|

网页解析高手:C#和HtmlAgilityPack教你下载视频

使用C#和HtmlAgilityPack解析小红书网页,下载其视频内容。文章涵盖了解析网页、获取视频链接、C#实现、HtmlAgilityPack简化解析、代理IP确保下载稳定及多线程提高下载效率。提供的代码示例展示了如何设置代理和多线程下载视频。实验结果显示,该方法能有效、高效地下载小红书视频。

33 5
|
5天前
|
数据库
|

Langchain中改进RAG能力的3种常用的扩展查询方法

有多种方法可以提高检索增强生成(RAG)的能力,其中一种方法称为查询扩展。我们这里主要介绍在Langchain中常用的3种方法

248 0
|
5天前
|
数据采集 JavaScript 前端开发
|

使用HtmlUnit库的Java下载器:下载TikTok视频

使用Java和HtmlUnit构建TikTok视频下载器,模拟浏览器行为,绕过访问限制。通过爬虫代理配置代理服务器,隐藏真实IP,多线程技术提升下载效率。示例代码展示如何设置HtmlUnit,创建代理,启用JavaScript,下载并处理视频链接。学习了页面模拟、JavaScript交互、代理使用及多线程技术,为实际爬虫项目提供参考。

45 0
|
5天前
|
存储 人工智能 自然语言处理
|

知识图谱与大模型双向驱动的关键问题和应用探索

图谱技术积极拥抱新一代AI技术体系,如大模型(Large Language Model, LLM),实现二者的双驱动增强,定义融合互通的技术范式和关键问题,借助LLM强大的语言理解能力,为基于非/半结构化数据的图谱构建提效,同时在用户问答中,语言要素和语义结构的理解也会更加精准。

176 0
|
5天前
|
云安全 弹性计算 Linux
|

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定:从入门到精通

【玩转幻兽帕鲁部署】阿里云幻兽帕鲁服务器搭建1分钟搞定:从入门到精通。

863 0
|
5天前
|
存储 关系型数据库 MySQL
|

数据仓库设计

数据仓库设计

57 3
|
5天前
|
机器学习/深度学习 前端开发 Python
|

探索Python中的集成方法:Bagging

探索Python中的集成方法:Bagging

35 6
|
5天前
|
机器学习/深度学习 算法 计算机视觉
|

[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN(更新添加小目标检测层yaml)

本文介绍了改进YOLOv5以解决处理复杂背景时可能出现的错漏检问题。

112 5
|
5天前
|
JSON 搜索推荐 API
|

唯品会商品详情数据接口Python

唯品会商品详情数据接口Python

20 1
|
5天前
|
开发者 Python
|

京东商品类目信息数据接口python

京东商品类目信息数据接口python

36 0
|
5天前
|
机器学习/深度学习 算法 测试技术
|

OpenAI Gym 中级教程——环境定制与创建

OpenAI Gym 中级教程——环境定制与创建

67 0
|
5天前
|
SQL Java HIVE
|

使用 Paimon + StarRocks 极速批流一体湖仓分析

本文整理自阿里云智能高级开发工程师王日宇,在 Flink Forward Asia 2023 流式湖仓(二)专场的分享。

79881 3
来自: 实时计算 Flink  版块
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
|

论文推荐:大语言模型在金融领域的应用调查

这篇论文总结了现有LLM在金融领域的应用现状,推荐和金融相关或者有兴趣的朋友都看看

64 0
|
5天前
|
数据采集 Web App开发 搜索推荐
|

项目配置之道:优化Scrapy参数提升爬虫效率

项目配置之道:优化Scrapy参数提升爬虫效率

23 0
|
5天前
|
存储 分布式计算 Apache
|

构建 Streaming?Lakehouse:使用 Paimon 和 Hudi 的性能对比

Apache?Paimon 和 Apache?Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文将在阿里云EMR 上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,然后分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

58010 8
来自: 实时计算 Flink  版块
|
5天前
|
人工智能 JSON 运维
|

AI大模型运维开发探索第三篇:深入浅出运维智能体

大模型出现伊始,我们就在SREWorks开源社区征集相关的实验案例。玦离同学提供了面向大数据HDFS集群的智能体案例,非常好地完成了运维诊断的目标。于是基于这一系列的实验和探索。本文详细介绍智能体在运维诊断中的应用探索。

511 2
来自: 大数据运维SREWorks  版块
|
5天前
|
存储 缓存 Dragonfly
|

微软开抢年收入上亿美元的 Redis 饭碗?开源性能遥遥领先的 Garnet:无需修改,Redis 客户端可直接接入

微软开源了高性能缓存系统Garnet,旨在挑战 Redis 和 Dragonfly。Garnet 基于 .NET8,提供高吞吐量、低延迟和跨平台支持。它支持 RESP 协议,允许大部分 Redis 客户端无缝迁移。Garnet 的特性包括多连接批量处理以提升扩展性和吞吐量,以及更好的延迟稳定性。适合于需要高性能缓存层来降低成本和提高应用性能的场景。Garnet 的集群模式允许动态键迁移和分片管理,且支持 TLS 和自定义扩展。其网络层设计减少了线程切换开销,存储层则具备丰富的 API 和事务支持。在基准测试中,Garnet 在吞吐量和延迟上优于 Redis 和 KeyDB,展现出优秀的扩展性。

342 0
|
5天前
|

round() 函数:对一个数进行四舍五入

round() 函数:对一个数进行四舍五入

59 0
|
5天前
|
Linux 数据安全/隐私保护
|

Linux权限管理

Linux权限管理是一种控制用户和程序对文件和文件夹的访问的方法。它使用三个主要的概念:所有者(owner)、群组(group)和其他(others)。 每个文件和文件夹都有一个所有者,这是创建该文件或文件夹的用户。所有者拥有最高的权限,可以对文件和文件夹进行更改、读取和删除。群组是一组用户,他们可以共享文件和文件夹的权限。其他用户是除所有者和群组以外的其他用户。 Linux使用三个主要的权限:读、写和执行。读权限允许用户查看文件或文件夹的内容,写权限允许用户更改文件或文件夹的内容,执行权限允许用户运行文件或文件夹中的程序。是一种控制用户和程序对文件和文件夹的访问的方法。它使用三个主要的概念:

17 1
|
5天前
|
人工智能 自然语言处理 安全
|

ChatGPT-5 最快将于 6 月发布

OpenAI计划推出ChatGPT-5,预计6月发布,企业客户已提前体验其增强的性能与定制化功能。模型将经过密集训练和严格安全测试,提升语言理解和交互的自然度。GPT-5将影响多个行业,带来商业机遇,同时引发关于伦理和安全的讨论。其在教育和医疗领域的应用前景广阔,但用户仍需注意信息验证。

131 0
|
5天前
|
SQL 分布式计算 数据处理
|

充分发挥 SQL 能力

MaxCompute(ODPS)SQL 发展到今天已经颇为成熟,作为一种 SQL 方言,可以高效地应用在各种数据处理场景。本文尝试独辟蹊径,强调通过灵活的、发散性的数据处理思维,就可以用最基础的语法,解决复杂的数据场景。

162519 4
来自: 大数据计算 MaxCompute  版块
|
5天前
|
存储 机器学习/深度学习 人工智能
|

基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践

随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。

84549 9
来自: 人工智能平台PAI  版块
|
5天前
|
分布式计算 运维 大数据
|

阿里云 EMR Serverless Spark 版免费邀测中

阿里云 EMR Serverless Spark 版,以 Spark Native Engine 为基础,旨在提供一个全托管、一站式的数据开发平台。诚邀您参与 EMR Serverless Spark 版免费测试,体验 100% 兼容 Spark 的 Serverless 服务:https://survey.aliyun.com/apps/zhiliao/iscizrF54

766 0
|
5天前
|
人工智能 自然语言处理 大数据
|

大模型+知识图谱双驱架构:新一代《知识语义框架SPG》白皮书

白皮书展望了SPG与LLM双向驱动的技术架构。通过基于SPG构建统一的图谱技术框架,可以屏蔽复杂的技术细节以支持新业务的快速部署,真正实现知识图谱技术的框架化、平民化、普惠化。

446 2
|
5天前
|
关系型数据库 MySQL
|

MySQL 的函数-2

MySQL 的函数-2

15 0
|
5天前
|
人工智能 安全
|

大模型放大了AI安全可信问题

【1月更文挑战第20天】大模型放大了AI安全可信问题

43 3
|
5天前
|
SQL OLAP HIVE
|

HQL的中级题目---炸裂函数、窗口函数

HQL的中级题目---炸裂函数、窗口函数

49 2
|
5天前
|
SQL Oracle 关系型数据库
|

SQL 的 with as 临时中间表

SQL 的 with as 临时中间表

42 1
|
5天前
|
存储 SQL 数据库
|

MySQL-存储过程概述

MySQL-存储过程概述

122 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
55217
内容
95
活动
437102
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务
  • http://www.vxiaotou.com