(13)标记照片点 p 为噪声
(14)如果所有照片点都已访问过,结束,否则转到(2)
2。2 描述旅游景点名称
在发现旅游景点之后,还需要为旅游景点添加一个名称作为其简单描述,使得旅游景点 具有一定的语义。为了获取各旅游景点的名称,本论文利用了一种结合了对照片进行注释的 文本标签以及在线 Web 服务来对每个旅游景点自动生成文本描述的方法。
本论文所采用的对每个旅游景点自动生成文本描述的方法主要由以下 3 个步骤组成:
(1)首先采用 Kennedy et al。 [27]描述的方法获取每个旅游景点 tl={Pl,gl}的具有代表性的文本 标签:对每个旅游景点 tl={Pl,gl}以及与照片集 Pl 相对应的标签集 Xl,利用基于 TF-IDF(一 种流行的排序方法并广泛应用于信息检索领域)的方法为每个属于标签集 Xl 的标签 tag 打分。 本论文所采用的 TF-IDF 的主要思想是:如果某个标签 tag 在一个标签集 Xl 中出现的频率高, 并且在其他标签集 Xl 中很少出现,则认为此标签 tag 具有很好的区分能力,能够很好地代表其 对应的旅游景点 tl。TF-IDF 的计算公式为:
tfidf = tf × idf (2。3)
其中,等式(2。1)中的分子