本文选取浙江省为研究区域,确定浙江省 244 个 3A 级以上景区为研究对象,基于网络 数据挖掘技术,通过获取微博签到数据,来得到浙江省内景区间旅游流的路径。根据这些旅 游流信息,探索浙江省景区间旅游流的空间流动机制和流动规律。
2 数据与研究方法
2。1 研究区域
浙江省位于我国东南沿海旅游经济发达地区,2014 年浙江省实现国内旅游收入 5947 亿 元,比上年增长 14。32%,外汇收入 57。53 亿美元,增长 6。69%。接纳国内游客 47875 万人次, 入境游客 931 万人次[20]。本文中研究区域包括浙江省旅游局网站公布的浙江省 11 个地级市
的 3A 级及以上景区(数据截止到 2016 年 3 月 1 日),根据实际情况对景区名单进行整理,
最终得到 244 个景区。本文以 244 个景区为研究对象,分析浙江省景区的旅游流空间分布格 局。
2。2 数据来源
本文利用网络数据挖掘技术,从新浪微博的用户签到数据中获取感兴趣点 POI,然后通 过对 POI 进行分类,得到属于浙江省 244 个景区内的 POI,利用这些 POI 的签到时间等信 息,整理出浙江省景区间的旅游游客转移路径。最终得到 244 个景区内部的 POI 共 4498 个, 每个 POI 上签到的人数不等。
具体是先获取景区数据 244 个,通过新浪微博提供的 API 接口获取景区 POI 数据,在 ArcGIS 中根据景区范围对 POI 进行分类,得到不同景区的 POI。然后对得到的景区位置签 到数据进行整理,去除无效的签到数据,得到旅游流位置数据,然后再去除其中未构成旅游 流的签到信息,整理成景区之间的旅游流路径数据。最终得到 POI 位置数据 26022 条,签 到用户数据 194537 条,不同用户的旅游流路径 276283 条,景区间的旅游流转移路径 15493
条,即 244 个景区之间的空间转移矩阵。文献综述
2。3 研究方法
图 1 位置签到数据获取及处理流程
本文前半部分先对浙江省景区的空间分布格局进行研究,归纳浙江省景区空间分布特征。 在后半部分利用社会网络分析方法[21]对浙江省旅游行为空间分布特征进行分析,总结景区 间旅游流空间流动特征和规律。
2。3。1 景区空间分布特征
研究景区分布特征有利于理解旅游流的形成机理与影响因素,以便解释后续的旅游行为 网络特征。
(1)最邻近指数 最邻近指数是以随机分布的状况作为一种标准去衡量点状目标的空间分布[22]。当点状
地物呈现随机分布时的平均距离作为理论平均距离。通过计算点状地物之间的实际平均距离, 将实际平均距离与理论平均距离的比值称作最邻近指数