1.前言
项目中,使用cassandra存储海量数据。例如,每个5秒上传的路况信息。使用传统的mysql数据库存储,过去一个月,数据量上亿,按设备编号,加时间范围查询,出现大量的慢查询。这样的数据插入后不会修改,应用中只会查询。
2.使用场景
一款分布式的结构化数据存储方案(NoSql数据库),存储结构比Key-Value数据库(像Redis)更丰富,但是比Document数据库(如Mongodb)支持度有限;适合做数据分析或数据仓库这类需要迅速查找且数据量大的应用。
3.简单实用
(1).linux上,从官网(https://cassandra.apache.org/)下载 tar.gz包。解压tar包。
命令: tar -zxvf apache.cassandra.2.1.18-bin.tar.gz
运行需要jdk环境。最好安装jdk1.7以上。配置jdk环境变量。(详细)
(2).配置文件是conf目录下,cassandra.yml文件,不修改。到bin目录,启动服务器。
命令:./cassandra -f
同时屏幕上加载配置,lib的jar包等一系列的信息。
最下方显示
CQL clients on /0.0.0.0:9042
thirft service to /0.0.0.0:9160
说明服务启动成功。
(3).客户端连接建立表:
在bin目录下,./cassandra-cli则进入
创建数据库:
create keyspace picture with placement_strategy = 'org.apache.cassandra.locator.SimpleStrategy' and strategy_options = {replication_factor:1};
在单个节点上创建了一个数据库。
创建表:
create column family t_common_list with column_type = 'Standard' and key_validation_class = 'LongType' /*id*/ and comparator = 'Int32Type' /*imageType*/ and default_validation_class = 'AsciiType' /*url*/;
4.从其他服务器上使用java程勋连接,连接被拒绝。
首先想到防火墙,没有开通9160端口。关闭防火墙了。(systemctl stop firewalld ->更多)
防火墙关闭了,还是连接被拒绝。
5.配置文件修改 conf/cassandra.yml
listen_address从localhost改为服务器ip
rpc_address从localhost改为0.0.0.0 ,同时broadcast_address为服务器ip
这样程序连接,操作数据正常 为什么这样设置,可参考。
相关推荐
Hadoop 安装 学习 入门教程 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, ...
以下是一个大数据开发的入门学习教程,帮助你了解大数据开发的基本概念、技术和工具。 一、了解大数据基础 定义与特点:首先,了解大数据的定义和特点,包括数据量大、类型多样、处理速度快等。 核心价值:理解...
JAVA 基础 Spring 原理 微服务 Netty 与 RPC 网络 日志 Zookeeper Kafka RabbitMQ 数据库 一致性算法 JAVA 算法 Spark 集合 多线程并发 设计模式 负载均衡 数据结构 加密算法 分布式缓存 机器学习 云计算 JVM ...
第一部分 NoSQL入门 第1章 NoSQL的概念及适用范围 2 1.1 定义和介绍 3 1.1.1 背景与历史 3 1.1.2 大数据 5 1.1.3 可扩展性 7 1.1.4 MapReduce 8 1.2 面向列的有序存储 9 1.3 键/值存储 11 1.4 文档数据库 ...
在实际开发中,爬虫开发的具体应用场景广泛且多样化,因此除了上述基础知识外,还需要根据实际情况灵活运用并拓展学习以下几个方面: 深度爬虫与广度爬虫:理解两种不同的爬取策略,并能根据需求选择合适的爬取方式...
要求Java >= 1.6 客户安卓 >= 4.0 云Apache Cassandra >= 1.2.5 OpenStack Swift >= 1.8.0 谷歌协议缓冲区 >= 2.5.0 Maven >= 3.2.1入门Simba 被分成几个独立的组件。 ###客户###云有关更多信息,请参阅 Simba...
规范分析 建⽴在预测分析的基础之上,包含了"⾏动"记录(例如减少⾷品、服装、娱乐⽀出),并分析所得结果来"规定"最佳类别以减少总体⽀ 出。你可以尝试将其发散到⼤数据,并设想⾼管们如何通过查看各种⾏动的影响来...
- **在线课程**:Coursera、edX、Udacity等平台提供了多门数据库相关的课程,涵盖从入门到高级的各种主题,比如Stanford大学的《数据库系统概念》课程。 - **书籍**:《数据库系统概论》(Silberschatz, Korth, ...
使用DataStax Astra的Apache Cassandra:trade_mark:和Python入门50分钟,中级,该示例Python后端提供了REST API服务,该服务一起使用,以显示有关如何连接和查询DataStax Astra数据库的简单示例。目标如何使用安全...
关于R基础编程和数据分析的书已经有很多,而张丹独辟蹊径,从一些较专业的扩展包入手,介绍了作为服务器的R,以及R语言和大数据技术的融合,非常符合当前发展潮流及本书标题所揭示的内容。”, ——黄志洪 ITPUB和炼...
非常适合想要深入学习并使用Python进行数据分析的读者,无论是新手还是有一定Python使用基础的读者,都将快速成为一名数据分析专家。 作者简介 Ivan Idris,实验物理学硕士,学位论文侧重于应用计算机科学。毕业后...
AWS Lambdas:轻松,轻松,最简单 :cooking: “ AWS变得过时的地方就是典型的JAMstack应用程序。 具有大量前端逻辑的静态站点。 将它们托管在AWS上是一件痛苦的事情,而Netlify和Vercel使它们成为核心功能。...