【使用攻略】【图像识别】地标识别让您了解天下名胜

首页版块访问AI主站注册发帖

精

才能我浪费99 发布于2019-05 浏览:25319 回复:56

【使用攻略】【图像识别】地标识别让您了解天下名胜

快速回复

最后编辑于2023-10

1.需求及方案：

在我以前的一个帖子https://ai.baidu.com/forum/topic/show/943365 里面讲了怎么通过图像分割来旅游。
这一次我要说一下怎么通过地标识别+百度百科带大家来看遍/认识天下名胜。

2.平台接入

地标识别接入网址：https://console.bce.baidu.com/ai/#/ai/imagerecognition/overview/index

具体接入方式比较简单，可以参考我的另一个帖子，这里就不重复了：
http://ai.baidu.com/forum/topic/show/943327

3.地标识别调用攻略（Python3）

3.1首先认证授权：

在开始调用任何API之前需要先进行认证授权，具体的说明请参考：

http://ai.baidu.com/docs#/Auth/top

具体Python3代码如下：

# -*- coding: utf-8 -*-
#!/usr/bin/env python

import urllib
import base64
import json
#client_id 为官网获取的AK， client_secret 为官网获取的SK
client_id =【百度云应用的AK】
client_secret =【百度云应用的SK】

#获取token
def get_token():
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
    request = urllib.request.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib.request.urlopen(request)
    token_content = response.read()
    if token_content:
        token_info = json.loads(token_content)
        token_key = token_info['access_token']
    return token_key

3.2 接口调用：
详细说明请参考：https://ai.baidu.com/docs#/ImageClassify-API/2c607890

说明的比较清晰，这里就不重复了。

大家需要注意的是：
API访问URL：https://aip.baidubce.com/rest/2.0/image-classify/v1/landmark
图片格式：Base64编码字符串，以图片文件形式请求时必填。(支持图片格式：jpg，bmp，png)，图片大小不超过4M。最短边至少15px，最长边最大4096px。注意：图片的base64编码是不包含图片头的

Python3调用代码如下：

#地标识别
#filename:图片名（本地存储包括路径）
def landmark(filename):
    request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/landmark"
    
    # 二进制方式打开图片文件
    f = open(filename, 'rb')
    img = base64.b64encode(f.read())
    
    params = dict()
    params['image'] = img
    params['show'] = 'true'
    params = urllib.parse.urlencode(params).encode("utf-8")
    #params = json.dumps(params).encode('utf-8')
    
    access_token = get_token()
    request_url = request_url + "?access_token=" + access_token
    request = urllib.request.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib.request.urlopen(request)
    content = response.read()
    landmark=''
    if content:
        #print(content)
        content=content.decode('utf-8')
        #print(content)
        data = json.loads(content)
        #print(data)
        words_result=data['result']
        landmark=words_result['landmark']
        print ('地标:',landmark)
        
    return landmark

4.应用方案：

4.1 整体方案：
首先调用地标识别API对地标图片进行识别。
然后通过百度百科对地标的具体情况进行搜索，并将结果展示给客户。

4.2 具体实现代码：

# -*- coding: utf-8 -*-
#!/usr/bin/env python

import urllib
import base64
import json
#client_id 为官网获取的AK， client_secret 为官网获取的SK
client_id =【百度云应用的AK】
client_secret =【百度云应用的SK】

#获取token
def get_token():
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
    request = urllib.request.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib.request.urlopen(request)
    token_content = response.read()
    if token_content:
        token_info = json.loads(token_content)
        token_key = token_info['access_token']
    return token_key

#地标识别
#filename:图片名（本地存储包括路径）
def landmark(filename):
    request_url = "https://aip.baidubce.com/rest/2.0/image-classify/v1/landmark"
    
    # 二进制方式打开图片文件
    f = open(filename, 'rb')
    img = base64.b64encode(f.read())
    
    params = dict()
    params['image'] = img
    params['show'] = 'true'
    params = urllib.parse.urlencode(params).encode("utf-8")
    #params = json.dumps(params).encode('utf-8')
    
    access_token = get_token()
    request_url = request_url + "?access_token=" + access_token
    request = urllib.request.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib.request.urlopen(request)
    content = response.read()
    landmark=''
    if content:
        #print(content)
        content=content.decode('utf-8')
        #print(content)
        data = json.loads(content)
        #print(data)
        words_result=data['result']
        landmark=words_result['landmark']
        print ('地标:',landmark)
        
    return landmark

from bs4 import BeautifulSoup
#通过百度百科获取地标的详细说明         
def get_baike_summary(itemname):
    url='https://baike.baidu.com/item/'+urllib.parse.quote(itemname)
    # 构建请求对象  
    headers = {  
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36"  
    }  
    request = urllib.request.Request(url, headers=headers)  
    # 发送请求  
    response = urllib.request.urlopen(request)  
    # 读取文件  
    content = response.read().decode('utf8')
    # 先构建一个soup对象      
    soup = BeautifulSoup(content, "lxml")  
    #获取描述
    summary = soup.find("div", attrs={"class": "lemma-summary"}).get_text()
    print (summary)


def get_landmark_more(filename):
    result=landmark(filename)
    get_baike_summary(result)
    
get_landmark_more('landmark1.jpg')

5 效果测试

以下是几个测试地标图片及返回结果。

地标: 埃菲尔铁塔

埃菲尔铁塔（法语：La Tour Eiffel；英语：the Eiffel Tower）矗立在塞纳河南岸法国巴黎的战神广场，于1889年建成，是当时世界上最高的建筑物。埃菲尔铁塔得名于设计它的著名建筑师、结构工程师古斯塔夫·埃菲尔，全部由施耐德铁器（现施耐德电气）建造。埃菲尔铁塔高300米，天线高24米，总高324米，铁塔是由很多分散的钢铁构件组成的——看起来就像一堆模型的组件。钢铁构件有18038个，重达10000吨，施工时共钻孔700万个，使用1.2万个金属部件，用铆钉250万个。除了四个脚是用钢筋水泥之外，全身都用钢铁构成，共用去熟铁7300吨。塔分三楼，分别在离地面57.6米、115.7米和276.1米处，其中一、二楼设有餐厅，第三楼建有观景台，从塔座到塔顶共有1711级阶梯。埃菲尔铁塔是世界著名建筑、法国文化象征之一、巴黎城市地标之一、巴黎最高建筑物。被法国人爱称为“铁娘子” 。埃菲尔铁塔2011年约有698万人参观，在2010年累计参观人数已超过2.7亿人，每年为巴黎带来15亿欧元的旅游收入。
[1]

地标: 胡夫金字塔

胡夫金字塔是古埃及金字塔中最大的金字塔。塔高146.59米，因年久风化，顶端剥落10米，现高136.5米，相当于40层大厦高。塔身是用230万块巨石堆砌而成，大小不等的石料重达1.5吨至160吨，塔的总重量约为684万吨，它的规模是埃及至今发现的110座金字塔中最大的。它是一座几乎实心的巨石体，成群结队的人将这些大石块沿着金字塔内部的螺旋上升通道往上拖运，然后逐层堆砌而成，十万多个工匠共用约20年的时间才完成的人类奇迹，当年埃菲尔铁塔还未建成时胡夫金字塔还曾是世界上最高的建筑物。

地标: 卢浮宫

卢浮宫（法语：Musée du Louvre）位于法国巴黎市中心的塞纳河北岸，位居世界四大博物馆之首。始建于1204年，原是法国的王宫，居住过50位法国国王和王后，是法国文艺复兴时期最珍贵的建筑物之一，以收藏丰富的古典绘画和雕刻而闻名于世。现为卢浮宫博物馆，占地约198公顷，分新老两部分，宫前的金字塔形玻璃入口，占地面积为24公顷，是华人建筑大师贝聿铭设计的。1793年8月10日，卢浮宫艺术馆正式对外开放，成为一个博物馆。卢浮宫已成为世界著名的艺术殿堂，最大的艺术宝库之一，是举世瞩目的万宝之宫。

通过测试发现识别的效果很好，速度很快，配合自动调取的百度百科的内容描述，效果非常的棒。

热门活动

个赞

共56条回复最后由192******42回复于2023-10

#82192******42回复于2023-10

#56js养成好习惯回复于2021-03

跑不出来，哭了

#55才能我浪费99回复于2019-05

对#54 蓝色的风339回复

百度搜索很强的

百度的搜素还是世界领先的

#54蓝色的风339回复于2019-05

对#52 才能我浪费99回复

诸事不明问百度

百度搜索很强的

#53蓝色的风339回复于2019-05

对#49 177******01回复

出去旅游的时候拍照同时识别

应该挺有意思的

#52才能我浪费99回复于2019-05

对#50 177******01回复

随时随地度娘一下

诸事不明问百度

#51才能我浪费99回复于2019-05

对#49 177******01回复

出去旅游的时候拍照同时识别

感觉很方便的，是吧

#50177******01回复于2019-05

随时随地度娘一下

#49177******01回复于2019-05

出去旅游的时候拍照同时识别

#48才能我浪费99回复于2019-05

对#47 小雨青青润无声回复

谢谢，我可以试一试

试验后说一下你的结果

#47小雨青青润无声回复于2019-05

对#42 蓝色的风339回复

做成APP,调摄像头

谢谢，我可以试一试

#46才能我浪费99回复于2019-05

对#40 果断叫小黑回复

智能写作接口来一下。

嗯，可以整合在一起

#45蓝色的风339回复于2019-05

对#44 才能我浪费99回复

做成手机APP或者小程序

这个APP什么时候能看到

#44才能我浪费99回复于2019-05

对#41 wangwei8638回复

加调用摄像头的模块

做成手机APP或者小程序

#43蓝色的风339回复于2019-05

对#39 小雨青青润无声回复

最好可以自己写简单的游记

这个建议不错

#42蓝色的风339回复于2019-05

对#38 小雨青青润无声回复

这个如何与拍照功能整合？

做成APP,调摄像头

#41wangwei8638回复于2019-05

对#38 小雨青青润无声回复

这个如何与拍照功能整合？

加调用摄像头的模块

#40果断叫小黑回复于2019-05

对#39 小雨青青润无声回复

最好可以自己写简单的游记

智能写作接口来一下。

#39小雨青青润无声回复于2019-05

对#34 才能我浪费99回复

出去旅游的时候拍照同时识别

最好可以自己写简单的游记

#38小雨青青润无声回复于2019-05

对#33 才能我浪费99回复

这个功能可以和拍照功能整合起来

这个如何与拍照功能整合？

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服