# 過去のブログの画像をダウンロードする

shinodogg.comというブログを長いことやっていて、最初はHTMLを手書きしてたのを、Movable Typeとかにした後に、さくらのサーバーを連拓してWordPressにして、AWSに転職した感じでELB-EC2-RDSというような感じで運用してきて、去年、年間契約してWordpress.comにしたのだけどあんまりテンション上がらず、会社のブログを翻訳した記事を載せるだけの媒体みたいになってしまいました…。

その代わりに、日本語のイイ感じのデータセットが無いよねってことで、んじゃちょっと自分でやってみよかなと思って、このヨシダレッドをはじめて、クローラーも自分で書いてAlgoliaにデータを突っ込んで〜みたいなことをしているわけなのですが。

そんなこんなで、shinodogg.comの方もまた別のプラットフォームに移行したいなと思っていて、今の所、候補はShifterかはてなブログなのですが、それより先にやっておきたいことが出てきました、と。

# PicasaとFlickrを使ってきた経緯がある

その昔はFlickrに画像を保存しておいて、それをEmbedしてブログとかに貼り付けるって、結構メジャーな方法だったと思うのですが、、

なんかヤケに👇が表示されるのですよね。。

//embedr.flickr.com/assets/client-code.js

TwitterやInstagramもそうなのですが…。まぁ、こっちは純粋に画像というよりはコメントも入ってしまっているので一旦目をつぶるとして、、

https://platform.twitter.com/widgets.js //www.instagram.com/embed.js

そして、Flickrより以前はPicasaというGoogleのサービスを使っていたのですが、これはサービスごとなくなってしまって、且つ、Googleの写真サービスではembed出来ないと。

ということで、今回ブログのお引越しをするにあたっては、

  • Wordpressの記事の中で使われているPicasaとFlickrの画像をダウンロードして然るべきところに保存する

というのをやってからにしたいな、と。。

# 手始めにCheerioでコード書き始めた

まぁ、いってもimgタグのsrc属性を抜き出してきて、"google"から"flickr"って文字が入ってたら、、っていうだけの簡単なものですが、、

$("img").each

あとはエクスポートしてきたWordPressのXMLファイルをどうやってアレするかな、と。。まぁファイル名が被ることはないだろうから、media-exportの方に習って、『yyyy/mm/ファイル名』みたいにしてやるのがイイのかな、、

この辺、知見をお持ちの方がいらっしゃったら、、

しかし、この際だから自分で全部記事をスクレイピングしてきてマークダウンにして保存とかしちゃってもイイんじゃないか?とか思ったり思わなかったりして。。

ブログひとつとっても何かとややっこしいですねぇ。笑

このエントリーをはてなブックマークに追加

Algolia検索からの流入のみConversionボタン表示