您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 山南分类信息网,免费分类信息发布

旅游大数据分析系统应该如何搭建?

2024/2/2 8:04:45发布16次查看
旅游大数据分析系统的搭建,需要先弄清楚旅游大数据分析系统有哪些组成部分?
对于整个数据分析体系来说,旅游限定的是具体的行业,这代表我们需要去了解旅游行业可以关注哪些数据指标,使用什么样的方法进行分析。
而大数据分析系统更多的指的是技术层面的问题,使用什么样的技术、能够把行业的数据进行收集、存储、分析、展现。
所以对于这个问题,可以从这两个方面分别来阐述:
一、旅游行业应该关注哪些指标?
我以一个省的旅游数据为例,那么可以分析的指标有:
省旅游收入分析(包括收入金额、增长率、与全国收入增长率对比)省内旅游情况分析(包括星级饭店总数、国内游客数、入境游客数、入境过夜游客、游客消费水平、旅行社数、旅游从业人员等)入境游客量分析(国外游客数、港澳同胞数、台湾同胞数、及其对应的增长率)旅游收入分析(商品销售、长途交通、住宿、景点门票、餐饮、邮电通讯)酒店分析(按客房数的多少可以分析出现阶段适合发展的酒店形式,是连锁酒店还是民宿更合适)
综合以上分析,就可以得出该省下一阶段在旅游方面应该去重点关注的地方,给规划提供判断依据。
二、大数据分析系统
大数据分析系统或者说大数据平台,其整体架构如下图
数据分析平台架构
从底层逐步往上,如图所示表示这么几个环节:
1.业务应用:其实指的是数据采集,你通过什么样的方式收集到数据。互联网收集数据相对简单,通过网页、app就可以收集到数据,更深层次的还能收集到用户的行为数据,可以切分出来很多维度,做很细的分析。但是对于涉及到线下的行业,数据采集就需要借助各类的业务系统去完成。当然你还可以通过一些公开的数据源或者爬虫去获取一些外部数据,来弥补你自身数据不足的现状。
2.数据集成:指的其实是etl,指的是用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。此处的kettle只是etl的其中一种。
3.数据存储:指的就是数据仓库的建设了,此处相对复杂,我不再赘述,大家可以详细看下图中『数据仓库层』这部分。
4.数据共享层:表示在数据仓库与业务系统间提供数据共享服务。不论是web service,还是web api ,都代表的是一种数据间的连接方式。
5.数据分析层:分析函数这部分大家都能理解,就是数学上的各种公式,比如聚类分析、回归分析等等。
列存储使得磁盘的每个page仅仅存储来自单列的值,而不是整行的值。因此,压缩算法会更加高效,因为它们能够作用于同类型的数据。再说的简单点,可以减少磁盘的i/o、提升缓存利用率,因此,磁盘存储会被更加高效的利用。
而分布式计算能够把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。整体上来说,通过这两种技术,可以大幅度提高数据分析的效率。
而yonghong mpp应该是目前做列存储和分布式最好的产品。
6.数据展现:分析的结果通过什么样的形式去呈现,说白了就是数据可视化的工作。这部分推荐用敏捷bi类的产品,区别于传统bi,它能通过简单拖拽的方式就生成报表,比较节省时间,学习成本相对较低。国内的敏捷bi中,个人用户推荐tableau,企业级需求推荐yonghong bi 。
7.数据访问:这个就比较简单了,看你是通过什么样的方式去查看这些数据,图中示例的是因为b/s架构,最终的可视化结果是通过浏览器访问的。当然也有c/s架构,通过客户端去查看。相对来说,b/s架构会比较便捷,更适合现在很多人用手机办公的需求,打开个网页就能看到数据。
以上是大数据分析系统搭建的架构概述,其中每一步都可能要涉及一些产品、技术以及具体的实施。
所以想要做好旅游行业的大数据分析系统,不仅要了解分析系统的技术层面的问题,也要了解旅游行业的业务,这样才能让数据发挥更有效的价值。
山南分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录