|
5天前
|
存储 运维 监控
|

面经:Cassandra分布式NoSQL数据库深度解读

【4月更文挑战第10天】本文是关于Apache Cassandra的面试准备指南,涵盖了数据模型、一致性模型、架构性能优化和故障恢复等核心知识点。作者强调理解Cassandra的列族、Tunable Consistency、Gossip协议及运维策略的重要性,并通过代码示例辅助解释。掌握这些内容不仅能帮助在面试中表现出色,也有助于实际工作中解决大规模数据处理问题。

31 1
|
5天前
|
存储 数据建模 数据挖掘
|

数据仓库中的数据建模-2

数据仓库中的数据建模-2

32 1
|
5天前
|
数据建模 数据挖掘 BI
|

为什么要数据建模?

为什么要数据建模?

48 2
|
5天前
|
存储 数据可视化 API
|

使用UMAP降维可视化RAG嵌入

大型语言模型(LLMs)如 GPT-4 已经展示了出色的文本理解和生成能力。但它们在处理领域特定信息方面面临挑战,比如当查询超出训练数据范围时,它们会产生错误的答案。LLMs 的推理过程也缺乏透明度,使用户难以理解达成结论的方式。

44 0
|
5天前
|
开发框架 前端开发 机器人
|

从模型到前端,你应该知道的LLM生态系统指南

LLM在在2023年发展的风生水起,一个围绕LLM的庞大生态系统正在形成,本文通过介绍这个生态系统的核心组成部分,来详细整理LLM的发展。

208 2
|
5天前
|
机器学习/深度学习 Python
|

探索XGBoost:深度集成与迁移学习

探索XGBoost:深度集成与迁移学习

93 2
|
5天前
|
机器学习/深度学习 算法 Python
|

探索XGBoost:参数调优与模型解释

探索XGBoost:参数调优与模型解释

100 2
|
5天前
|
SQL 存储 JSON
|

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良,在 Flink Forward Asia 2023 主会场的分享。

71646 4
来自: 实时计算 Flink  版块
|
5天前
|
算法
|

MATLAB | 插值算法 | 一维interpn插值法 | 附数据和出图代码 | 直接上手

MATLAB | 插值算法 | 一维interpn插值法 | 附数据和出图代码 | 直接上手

43 0
|
5天前
|
编解码
|

MATLAB | SCI 绘图配色第五期 | 二维横轴柱状图 | 镇魂街

MATLAB | SCI 绘图配色第五期 | 二维横轴柱状图 | 镇魂街

24 0
|
5天前
|
算法 jenkins 持续交付
|

【MATLAB 】 EEMD-ARIMA联合时序预测算法,科研创新优选算法

【MATLAB 】 EEMD-ARIMA联合时序预测算法,科研创新优选算法

52 0
|
5天前
|
编解码 移动开发
|

MATLAB | SCI 绘图配色第八期 | 散点图 2x1 | 大鱼海棠

MATLAB | SCI 绘图配色第八期 | 散点图 2x1 | 大鱼海棠

39 0
|
5天前
|
编解码
|

MATLAB | SCI 绘图配色第六期 | 三维折线图

MATLAB | SCI 绘图配色第六期 | 三维折线图

72 0
|
5天前
|
编解码
|

MATLAB | 科研绘图第二十二期信号分解中用于展示效果的三维瀑布图

MATLAB | 科研绘图第二十二期信号分解中用于展示效果的三维瀑布图

33 0
|
5天前
|
编解码 资源调度
|

MATLAB | 绘图配色第九期带高斯分布的直方图

MATLAB | 绘图配色第九期带高斯分布的直方图

48 0
|
5天前
|
编解码
|

MATLAB | 科研绘图第十六期三Y轴图

MATLAB | 科研绘图第十六期三Y轴图

29 0
|
5天前
|
并行计算 算法 计算机视觉
|

【MATLAB 】 CEEMD 信号分解+模糊熵(近似熵)算法

【MATLAB 】 CEEMD 信号分解+模糊熵(近似熵)算法

55 0
|
5天前
|
编解码
|

MATLAB | 科研绘图第二十三期箭头图

MATLAB | 科研绘图第二十三期箭头图

39 0
|
5天前
|
算法 计算机视觉
|

【MATLAB 】mlptdenoise 信号分解+希尔伯特黄变换+边际谱算法

【MATLAB 】mlptdenoise 信号分解+希尔伯特黄变换+边际谱算法

39 0
|
5天前
|
机器学习/深度学习 数据采集 算法
|

【MATLAB】BiGRU神经网络回归预测算法

【MATLAB】BiGRU神经网络回归预测算法

119 0
|
5天前
|
设计模式 Java
|

根据JDK源码Calendar来看工厂模式和建造者模式

根据JDK源码Calendar来看工厂模式和建造者模式

41 3
|
5天前
|
关系型数据库 MySQL Java
|

Flink cdc报错问题之内存不足报错如何解决

Flink CDC报错指的是使用Apache Flink的Change Data Capture(CDC)组件时遇到的错误和异常;本合集将汇总Flink CDC常见的报错情况,并提供相应的诊断和解决方法,帮助用户快速恢复数据处理任务的正常运行。

193 0
来自: 实时计算 Flink  版块
|
5天前
|
数据采集 数据可视化 算法
|

Python在大数据分析中的力量:Pandas、NumPy与SciPy

【4月更文挑战第8天】Pandas、NumPy和SciPy是Python数据分析的核心,构成其在大数据领域的重要地位。Pandas提供高效的数据操作,包括DataFrame和Series结构,以及数据清洗和预处理工具。NumPy专注于数组计算,提供高性能的ndarray和数学函数。SciPy则包含专业算法,适用于科学与工程计算。这三者协同工作,覆盖数据分析的全过程,形成强大的Python生态系统。随着社区的不断创新和新库的涌现,如Dask和CuDF,Python在大数据分析领域的潜力将持续增长。

54 0
|
5天前
|
监控 关系型数据库 MySQL
|

Flink cdc报错问题之读取mysql报错如何解决

Flink CDC报错指的是使用Apache Flink的Change Data Capture(CDC)组件时遇到的错误和异常;本合集将汇总Flink CDC常见的报错情况,并提供相应的诊断和解决方法,帮助用户快速恢复数据处理任务的正常运行。

216 0
来自: 实时计算 Flink  版块
|
5天前
|
Oracle 关系型数据库 数据库连接
|

Flink cdc报错问题之读取pgsql报错如何解决

Flink CDC报错指的是使用Apache Flink的Change Data Capture(CDC)组件时遇到的错误和异常;本合集将汇总Flink CDC常见的报错情况,并提供相应的诊断和解决方法,帮助用户快速恢复数据处理任务的正常运行。

202 0
来自: 实时计算 Flink  版块
|
5天前
|
存储 机器学习/深度学习 算法
|

10个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题

49 0
|
5天前
|
运维 数据可视化 测试技术
|

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月,已经有了一个用于时间序列预测的开源基础模型:laglllama。

190 2
|
5天前
|
Linux
|

linux端口2

linux端口2

24 0
|
5天前
|
监控 供应链 数据挖掘
|

ERP系统在中小企业的实施案例分析

ERP系统在中小企业的实施案例分析

47 1
|
5天前
|
Python
|

Python接口-2

Python接口-2

59 0
|
5天前
|
数据采集 机器学习/深度学习 存储
|

使用LORA微调RoBERTa

模型微调是指在一个已经训练好的模型的基础上,针对特定任务或者特定数据集进行再次训练以提高性能的过程。微调可以在使其适应特定任务时产生显着的结果。

116 0
|
5天前
|
存储 数据挖掘
|

维度建模-3

维度建模-3

97 3
|
5天前
|
算法 数据可视化 API
|

使用PyOD进行异常值检测

异常值检测各个领域的关键任务之一。PyOD是Python Outlier Detection的缩写,可以简化多变量数据集中识别异常值的过程。在本文中,我们将介绍PyOD包,并通过实际给出详细的代码示例

54 0
|
5天前
|
存储 Python
|

如何使用Python实现“猜数字”游戏

本文介绍了使用Python实现“猜数字”游戏的过程。游戏规则是玩家在给定范围内猜一个由计算机随机生成的整数,猜对则获胜。代码中,首先导入random模块生成随机数,然后在循环中获取玩家输入并判断大小,提供猜小、猜大提示。通过增加猜测次数限制、难度选择、优化输入提示和图形化界面等方式可优化游戏。这篇文章旨在帮助初学者通过实际操作学习Python编程。

42 2
|
5天前
|
SQL 数据可视化 数据挖掘
|

EMR Notebook 开启公测,提供交互式数据分析平台

EMR Notebook 是一个 Serverless 化的交互式数据分析和探索平台,满足大数据和 AI 融合下的数据处理需求,现已开启免费公测,欢迎体验!

195 3
|
5天前
|
机器学习/深度学习 算法 数据建模
|

探索XGBoost:时间序列数据建模

探索XGBoost:时间序列数据建模

79 2
|
5天前
|
JavaScript 前端开发 安全
|

JavaScript中的循环控制:while、do-while与for详解

【4月更文挑战第7天】本文探讨JavaScript的三种主要循环结构:while、do-while和for。while循环在满足条件时执行代码块,注意避免无限循环;do-while循环至少执行一次,适合先执行后判断的场景;for循环结合初始化、条件和迭代,适合遍历。理解每种循环的特点和适用场景,结合编程技巧,如使用break和continue,选择合适的循环方式,能提升代码效率和可读性。记得关注循环性能和避免不必要的计算。

20 0
|
5天前
|
JavaScript 前端开发 算法
|

JavaScript 中的 if 判断:深入理解、实战应用与进阶技巧

【4月更文挑战第7天】探索 JavaScript 中的 if 判断语句,它是构建逻辑清晰程序的基础。了解其概念、语法、应用示例及编程技巧,包括条件控制、else if 结构、三目运算符。注意条件表达式简洁性,避免 falsy 值陷阱,利用逻辑运算符优化,并减少 if 嵌套。实践这些技巧将提升编程能力和代码质量。

30 0
|
5天前
|
关系型数据库 MySQL
|

MySQL 函数-3

MySQL 函数-3

17 0
|
5天前
|
算法 Python
|

深入理解XGBoost:集成学习与堆叠模型

深入理解XGBoost:集成学习与堆叠模型

143 1
|
5天前
|
Linux
|

linux中history命令-3

linux中history命令

27 0
|
5天前
|
资源调度 前端开发 测试技术
|

前端工程化实践:从零搭建现代化项目构建流程

【4月更文挑战第6天】本文介绍了前端工程化的概念和重要性,包括模块化、自动化、规范化和CI/CD。接着,讨论了选择合适的工具链,如包管理器、构建工具和测试框架。然后,详细阐述了如何从零开始搭建一个基于React的现代化项目构建流程,涉及初始化、代码规范、测试、CSS处理、代码分割和CI/CD配置。最后,提到了持续优化与迭代的方向,如性能优化、类型检查和微前端。通过这样的实践,开发者可以提升开发效率和代码质量,为项目长远发展奠定基础。

45 0
|
5天前
|
存储 缓存 数据处理
|

Flink 2.0 状态存算分离改造实践

本文整理自阿里云智能 Flink 存储引擎团队兰兆千在 FFA 2023 核心技术(一)中 的分享,内容关于 Flink 2.0 状态存算分离改造实践的研究。

471 1
来自: 实时计算 Flink  版块
|
5天前
|

random.shuffle(lst)

random.shuffle(lst)

19 0
|
5天前
|

linux-find查找文件和目录-1

linux-find查找文件和目录

27 7
|
5天前
|
机器学习/深度学习 存储 算法
|

机器学习中的10种非线性降维技术对比总结

降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量,降维算法属于无监督学习的范畴,用未标记的数据训练算法。

126 4
|
5天前
|

rstrip()

rstrip()

13 0
|
5天前
|

strip()

strip()

75 0
|
5天前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

为什么大型语言模型都在使用 SwiGLU 作为激活函数?

SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对他进行详细的介绍。

81 9
|
5天前
|
Linux
|

linux端口3

linux端口3

18 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
55217
内容
95
活动
437102
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务
  • http://www.vxiaotou.com