IMPORTHTML(インポートHTML) - Googleスプレッドシート関数

IMPORTHTML(インポートHTML) - Googleスプレッドシート関数

IMPORTHTML(インポートHTML)は、指定したHTMLページのソースからクエリ(listタグまたはtableタグ)を指定して文字列を抜き出します。

・関数IMPORTHTML(読み方:インポートエイチティーエムエル)
・書式=IMPORTHTML(URL,クエリ,指数)
・内容ページのソースからクエリを指定して文字列を抜き出します。
URL
検証するページのURL(http://、https://から始まる絶対値)

クエリ
目的のデータを含むアイテムの種類を "list"か "table"で指定します
"table"は<table>タグで1つの<table>を"1"と数えます
"list"は<ul>タグを"1"と数え<li>タグ内を表示します
リスト例
<ul style="margin: 0px 0px 20px -20px;">
<li>DETECTLANGUAGE</li>
<li>GOOGLETRANSLATE</li>
<li>IMPORTHTML</li>
</ul>

指数
対象の表またはリストについて何番目に表示されるか1から順に指定します

例)セルB4:このページの"table"を呼び出します
=IMPORTHTML("https://google.dw230.com/importhtml","table",1)

スプレッドシート表サンプル
  A B C D
1      
2    ・関数  *IMPORTHTML*  
3    ・書式  =IMPORTHTML(URL,クエリ,指数)  
4    ・内容  指定したURLからクエリを指定して文字列を抜き出します。  
5        
6      DETECTLANGUAGE  
7      GOOGLETRANSLATE  
8      IMPORTHTML  
9        
スプレッドシート表サンプルの”セル B2”の数式
=IMPORTHTML("https://google.dw230.com/importhtml","table",1)
このページの関数の紹介のテーブルが表示されます
※太字や色は無視されます(<storong>タグは「*」?)

スプレッドシート表サンプルの”セル C6”の数式
=IMPORTHTML("https://google.dw230.com/importhtml","list",1)
このページのリスト例のリストが表示されます

対象クエリが見つからない場合「#N/A」エラーを返します
IMPORTHTMLで取得した文字化けする場合

IMPORTHTMLはWEBページがUTF-8以外だと文字化けします

自分で作成したページならばUTF-8に変更すればよいですが、変更できない場合
裏技的な取得方法としては
YAHOOの検索結果にある「キャッシュ」
キャッシュはUTF-8に変換されていますから文字化けせず取得できます

YAHOO検索とbing検索のキャッシュからは取得できますが、Google検索のキャッシュからは「URL を取得できませんでした」とエラーになります
IMPORTHTML関数を使用した関連ページ
「IMPORTHTML」と「IMPORTXML」の違い
IMPORTHTMLとよく使う関数
 ISURL  指定した値が有効な URL であるかどうかを検証します
 VLOOKUP  特定の値を検索
 SPLIT  区切り文字でセルを分割します
 LEN  文字列の文字数を返します


IMPORTHTML(インポートエイチティーエムエル)>HOME

Googleスプレッドシート関数

ネット上からデータを取得する関数

DETECTLANGUAGE(ディテクトランゲージ) テキストで使用される言語を識別して言語コードを返します

GOOGLETRANSLATE(グーグルトランスレート) 言語コードを指定して表示されている言語を翻訳します

ISURL(イズユーアールエル) 指定した値が有効な URL であるかどうかを検証します

IMAGE(イメージ) セル内に画像のURLを指定することで画像を表示します

IMPORTDATA(インポートデーター) 指定したファイルからタブ区切り、カンマ区切りで文字列を抜き出します

IMPORTFEED(インポートフィード) RSSフィードやAtomフィードをインポートします

IMPORTHTML(インポートHTML) ページのソースからクエリを指定して文字列を抜き出します

IMPORTXML(インポートエックスエムエル) さまざまな種類のデータから文字列をインポートします

(C) 2024 Digital World