Python入門

タイトル:ボールパイソン (見て楽しめる爬虫類・両生類フォトガイドシリーズ)

著者:Go!! Suzuki

出版社:誠文堂新光社

発行日:2014-03-19

Pythonで遊ぶ。

Python導入

入門本でも買いに行こうかと思ったけど、雨降ってるのでやめる。
適当に検索したPythonWeb(http://www.pythonweb.jp/)でPython入門。
まず、公式サイト(https://www.python.org/)からPython3.62をダウンロード。
書いたプログラムはコマンドプロンプトで実行する。
コマンドプロンプトって初めて使う。
WIN10ではWindowマークを右クリック→ファイル名を指定して実行(cmd.exe)

◆コマンドプロンプトメモ
デスクトップに移動する→cd desktop
前回コマンド→F3

# coding: UTF-8
# python-3.6.2
print ("Hello world")

↑で「Hello world」が無事表示でき、とりあえず導入完了。
Python2とPython3は互換性がないらしいので、ネット検索の際はPython2の古い情報に注意が必要。

キーボード操作

キーボード操作をやりたい。
検索かけると「pyAutoGUI」を使う方法があった
→Pythonでキーボード入力を自動化する方法を現役エンジニアが解説【初心者向け】(https://techacademy.jp/magazine/46562)
「pyAutoGUI」はライブラリの一つ。ライブラリは、PyPI(パイパイ)(Python Package Index)にしまってあってpip(ピップ)(The Python Package Installer)と呼ばれるツールを使用してインストールできる。

pip install pyautogui

ライブラリを使用するときはプログラムの初めに、import~と記載する。

import pyautogui

コメントアウトは「#」。

# 文字入力
import pyautogui
pyautogui.write('Hello world!')

WEBスクレイピング2

pythonでwebスクレイピングする。
最終目標はMGSの新着動画ページ(https://www.mgstage.com/search/cSearch.php?search_word=&sort=new&list_cnt=30&range=latest&type=top)をスクレイピングしようと思う。

まずスクレイピングの基礎から。

python3でwebスクレイピング(Beautiful Soup)(https://qiita.com/mtskhs/items/edf7dbba9b0b0246ef8f)
を参考にこのサイトをスクレイピングしてみる。

import requests
from bs4 import BeautifulSoup
url ="https://hytool.org/"
response = requests.get(url)
soup = BeautifulSoup(response.content, 'lxml')
print(soup)

これで、このサイトの「doctype html」から「/html」までの全てのソースコートが取得できる。
find~を指定すると取得する値をタグ等で指定できる。

# タグで取得
print (soup.find_all("h1"))
print (soup.find_all("a"))
print (soup.find_all("img"))

クッションページを回避してスクレイピング

MGSは年齢認証のクッションページがあるため、上記のコードではクッションページのスクレイピングをしてしまう。
Pythonで年齢認証などのクッションページを回避してスクレイピングしたい(https://qiita.com/aizakku_nidaa/items/71829aa111be68843b8b)
を参考にやってみる。
どうやらクッキーを渡せば良いらしい。
クッキーは【Chrome】Cookieを確認する方法(https://coeure.co.jp/blog/pc_support/chrome_cookie_180208)で調べる。
クッキー消したりして年齢認証のクッキーを特定↓

参考サイトと同じクッキーだった。
書いた人もMGSのスクレイピングしてたのだろうか。

import requests
from bs4 import BeautifulSoup
url = 'https://www.mgstage.com/search/cSearch.php?search_word=&sort=new&list_cnt=30&range=latest&type=top'
cookie = {'adc': '1'}  # 名前:コンテンツ
soup = BeautifulSoup(requests.get(url, cookies=cookie).content, 'lxml')
print(soup)

xmlに書き込む

取得できたのでxmlにする。
①BeautifulSoupで値を取得
②ループ処理
③XMLファイルへの書き込み

import requests
from bs4 import BeautifulSoup
import datetime
dt_now = datetime.datetime.now()
print(dt_now)
url = 'https://www.mgstage.com/search/cSearch.php?search_word=&sort=new&list_cnt=30&range=latest&type=top'
cookie = {'adc':'1'} #名前:コンテンツ
soup = BeautifulSoup(requests.get(url, cookies=cookie).content, 'lxml')
rank_list = soup.find('div', class_="rank_list") #soupからrank_listのみ指定
rank_list_li = rank_list.find_all('li') #rank_listから全てのliを指定
item_xml = '' #not definedエラー避け
for oisii_soup in rank_list_li: #for 変数名 in 繰り返し条件:→「rank_list_li」の数だけ繰り返し処理
	title = oisii_soup.find('p', class_="title lineclamp") #タイトル取得
	title = title.get_text() #テキストのみ
	title = title.replace('&', '&')#XML用エスケープ
	print(title)
	img = oisii_soup.h5.img['src'] #画像URL取得
	print(img)
	href = oisii_soup.h5.a['href'] #リンクURL取得
	link = "https://www.mgstage.com/"+href #パス追加
	print(link)
	item_xml_temp = "		<item>\n		<title>"+title+"</title>\n		<link>"+link+"</link>\n		<pubDate>2020-11-22T12:07:00+09:00</pubDate>\n		<description><![CDATA[<a href='"+link+"'><img src='"+img+"'></a>]]></description>\n		</item>\n\n"
	item_xml = item_xml + item_xml_temp
before_xml = "<?xml version='1.0' encoding='UTF-8' ?>\n<rss version='2.0'>\n<channel>\n	<title>MGS新着動画のRSSフィード</title>\n	<link>https://www.mgstage.com</link>\n	<description>MGS新着動画のRSSフィード</description>\n	<lastBuildDate>2020-11-22T12:36:02+09:00</lastBuildDate>\n	<language>ja</language>\n"
after_xml = '</channel>\n</rss>'
merge_xml = before_xml+item_xml+after_xml
f = open('test.xml','w') #出力(w=上書き/a=追記)
f.write(merge_xml)
f.close()

レンタルサーバーで動かす

……挫折。
スターサーバーで動かそうとしたけど、上手く行かなかった。
やはりWEBサイトに出力するならPHPの方が使いやすいか。

PHPでwebスクレイピング

pythonに挫折した僕はPHPでスクレイピングする。
別にそこまでMGSの情報が欲しいわけでもなかったのだけど。
使い慣れた「simple_html_dom」使う。処理が重たい以外の欠点がない。
というか処理が重いからPython使ってみたかったところもあるが。
ともかく、クッキー渡したことないのでそこをやる。
スクレイピングをしてみよう 認証・リダイレクト回避編(http://www.lesson5.info/?p=203)を参考に進める。
内容は理解してないけど、書いてある通りやって解決↓

<?php
include __DIR__."/function/simple_html_dom.php";
$item_url = 'https://www.mgstage.com/search/cSearch.php?search_word=&sort=new&list_cnt=30&range=latest&type=top';
$opts = array(
'http'=>array(
'method' => 'GET',
'header' =>
"Referer: https://www.mgstage.com\r\n". // リファラーをセット
"Cookie: adc=1\r\n") );// 認証のクッキーの名前が「adc」で値が「1」
$context = stream_context_create($opts);
$html = file_get_html($item_url, false, $context);
foreach ($html->find('div') as $entry) {
echo $entry;
}
?>

あとはなんやかんやしてXMLに出力。
レンサバのCRON設定で1日1日くらい更新させておく。
エクセルとかに出力して分析するとかならPythonが便利そうではあるけど、レンサバでただただ情報を自動更新させときたいならPHPの方が良い気がする。
というかレンサバ=ウェブサイト=PHPの相性が良い。

2017年夏アニメ

タイトル:メイドインアビス Blu-ray BOX 上巻

著者:

出版社:KADOKAWA メディアファクトリー

発行日:

メイドインアビス☆☆☆
面白い。ワクワク冒険もの。
はじめてのギャル☆☆☆
ビッチギャルかわいい。
ツッコミのタカトシ感好き。初めから最後まで面白かった。
ノラと皇女と野良猫ハート☆☆☆
これからたいへん。
ヒジ確姉さんすき。
アホガール☆☆
あほ。予想以上に面白い。
信長の忍び☆☆
楽しい忍び。
セントールの悩み☆☆
意外な話の方向性で面白かった。
NEW GAME!!
2期。かわいい。
異世界食堂
まぁまぁ
賭ケグルイ
顔芸。
ようこそ実力至上主義の教室へ
まぁまぁ。
てーきゅう
てーきゅう。

善悪【ゲーム】

タイトル:善悪

著者:

出版社:WAFFLE

発行日:

エロゲー。
なかなか良かった。ノベルゲー。
ストーリーは、4人の不良に尋問と復讐をする話。
リョナまでは行かないけど、エロ拷問的なシーンがメイン。
ボリュームも満足感のある量でなかなか満足。
強いて不足点を言うなら、泣いて謝る場面がもっと欲しかった。

コスプレ×脱出ゲーム 隠れSな幼馴染とミステリーハウスに閉じ込められたら【ゲーム】

タイトル:コスプレ×脱出ゲーム 隠れSな幼馴染とミステリーハウスに閉じ込められたら

エロゲー。
ジャンルは脱出ゲーム。
難易度高め。わっかんねーよと詰まったら攻略メモ見つつプレイ。
メッセージスキップ機能がないのが少し歯がゆいところ。
幼馴染のキャラは好き。エロは少ないが良ゲー。1時間くらいでクリア。

FC2コンテンツマーケット【アフィリエイト】

タイトル:エロい副業 個人が個人にエロを売る一億総AV時代 (コア新書)

著者:鳥胸インターネット

出版社:コアマガジン

発行日:2016-11-02

FC2コンテンツマーケット

デジタルコンテンツの闇市こと『FC2コンテンツマーケット』。
素人大学生の小遣い稼ぎから、怪しい専門業者、果てはAVの転売という相当闇深いコンテンツがやり取りされている。
同種のマーケットプレイス『デジポット』『Gcolle』も大概薄暗いけど、『FC2コンテンツマーケット』はとびぬけて無法地帯。
で、なんとなく気が向いたので『FC2コンテンツマーケット』のアフィリエイトを始めてみた。
アフィ報酬は1件売れて25円~100円ってところ。
(※低価格(500~1000円)でアフィ報酬が5%~10%くらい。)
しかしもあまり報酬がよくないからか、アフィリエイトを貼ってるサイトにあまり出くわしたことがない。穴場っちゃ穴場かも。

アフィ細則

Cookie(クッキー)の有効期間は30日。魅力的な長さ。とりあえず踏ませとけの精神。
報酬はポイント支給。換金は10,000ポイントから。
FC2コンテンツマーケット>アフィリエイトを始める(https://help.fc2.com/contentsmarket/manual/group162/1136)

ブログパーツ(公式)

感想とか

とりあえず始めてみたけどあまり手ごたえがない。
コンテンツの寿命が短く(すぐ消える)リンク切れを起こしやすいのがイマイチ。個別記事を作成するならベストセラーから選ぶのが良策。

17/09/03追記

2ヶ月間(7月~8月)サイドバーに表示した結果、6件売れて924円の収益。
30万PVくらいに露出したので1PV当たりは0.003円。
思ったよりは売れたけど、思った通り報酬が低い。
924円の内訳↓

1件あたりの報酬は平均160円。

ブログパーツ

公式のブログパーツがイマイチだったので自分用に作る。

◆設定
・APIがないので、PHPでランキングページ(http://adult.contents.fc2.com/ranking/article/realtime)をスクレイピング。
・無修正画像が嫌なので、画像はモザイク加工する。

◆表示サンプル↓

FC2コンテンツマーケット新着表示ツール(https://aztool.org/azfc.php)

領地貴族【ゲーム】

タイトル:領地貴族

著者:

出版社:ソフトハウスキャラ

発行日:

エロゲー。
ソフトハウスキャラ製。相変わらずの程よいゲーム性で楽しめた。
ただ個人的に好みのシチュエーションが少ないのが惜しい。第3王子のイベントが好きなくらい。もっと陵辱的なパターンもほしい。
ゲームジャンルはSLG。周回プレイ想定で難易度は低め。
エンディング集めるのは難しい。色々試したけど23/27までしか埋まらなかった。埋まってないのがレオナAとコルネE?とあと1パターン?
・エンディング攻略メモ
戦闘上げる→戦闘王
治安を下げる→闇のボス
何もしない→怠惰

たままお1.5 ~忘れられしメカモンの逆襲~【ゲーム】

タイトル:たままお1.5 ~忘れられしメカモンの逆襲~

エロゲー。
ルクスルフトは前作『セイクリッド』が面白かったのでプレイ。
『たままお ~乗っ取られた魔王城を取り返せ~』の続編らしいけど未プレイでもでも問題なく楽しめる。
ゲームはRPGでサクサク進めて楽しい。
ガチャシステムがおもしろかった。ソシャゲ課金の深淵を覗く。
3時間くらいでクリア。手軽さが嬉しい。

2017年8月【読んだ本】

タイトル:魔王の秘書 1 (アース・スターコミックス)

著者:鴨鍋 かもつ

出版社:アース・スター エンターテイメント

発行日:2017-04-12

1巻。
コミックス版。最後にちょっとだけオリジナル漫画。
話間のおまけ絵がちょっと面白くて好き。

タイトル:ハンドレッドゲーム 3 完結 (バンブーコミックス COLORFUL SELECT)

著者:久遠 ミチヨシ

出版社:竹書房

発行日:2016-12-26

1-3巻(完)
エロ寄りのサスペンス話。そこそこ。

タイトル:だがしかし(8) (少年サンデーコミックス)

著者:コトヤマ

出版社:小学館

発行日:2017-08-10

8巻。
ほたるさん復活。

タイトル:ゴブリンスレイヤー5 (GA文庫)

著者:蝸牛 くも

出版社:SBクリエイティブ

発行日:2017-05-12

1-5巻。
えぇのお。
毎度毎度女の子がひどい目にあうダークファンタジー。しかしそれでいて微笑ましいシーンが多く読み悪さはない。
非常に面白かった。

タイトル:かぐや様は告らせたい~天才たちの恋愛頭脳戦~ 6 (ヤングジャンプコミックスDIGITAL)

著者:赤坂アカ

出版社:集英社

発行日:2017-07-19

6巻。
おもろい。かぐや様の顔芸が良い。

タイトル:裏世界ピクニック ふたりの怪異探検ファイル (ハヤカワ文庫JA)

著者:宮澤 伊織

出版社:早川書房

発行日:2017-02-25

SF。
そこそこ面白かった。

タイトル:代償 (角川文庫)

著者:伊岡 瞬

出版社:KADOKAWA/角川書店

発行日:2016-05-25

こわい。次から次から不吉。
タイトルの『代償』が誰の何に対する代償なのかが最後まで恐ろしかった。
悪への代償なのか幸福の代償なのか。

タイトル:最後にして最初のアイドル

著者:草野 原々

出版社:早川書房

発行日:2016-11-22

B級小説。
アホらしくて面白い。
価格が130円と超手頃。買って損はない。

タイトル:エンペラーといっしょ 1 (ジャンプコミックス)

著者:mato

出版社:集英社

発行日:2016-04-04

1巻。
癒やし。ペングーかわいい。

タイトル:この島には淫らで邪悪なモノが棲む(7) (電撃コミックスNEXT)

著者:原 つもい

出版社:KADOKAWA / アスキー・メディアワークス

発行日:2017-07-27

1-7巻。
ちょっとエロい。結末が気になる。

タイトル:Pumpkin Scissors(21) (月刊少年マガジンコミックス)
著者:岩永亮太郎
出版社:講談社
発行日:2017-08-17

21巻。
待望の21巻。面白すぎた。
そろそろ展開進んで欲しいなーとは思ってたけど、ここまで面白くぶっ飛ぶとは。
伍長攻撃力高すぎ!世界に電撃走る!!
「きゅ……休憩とかちゃんと挟んだほうがいいんじゃないか……な……!」
これだよこれを待ってたんだ。やったれ伍長。
表紙も表紙で良い表紙っすわ。

タイトル:火の粉 (幻冬舎文庫)
著者:雫井 脩介
出版社:幻冬舎
発行日:2004-08-01

面白かった。
序盤社会派サスペンスかと思って読み進めていたが、徐々にサイコホラーじみてくる。
ワクワクというよりドキドキ。

タイトル:千年鬼 (徳間文庫)
著者:西條 奈加
出版社:徳間書店
発行日:2015-08-07

健気な鬼のファンタジー。
まぁまぁ

タイトル:ONE PIECE 86 (ジャンプコミックス)
著者:尾田 栄一郎
出版社:集英社
発行日:2017-08-04

86巻。
ビッグマム過去編。

タイトル:監獄学園(26) (ヤングマガジンコミックス)
著者:平本アキラ
出版社:講談社
発行日:2017-08-04

26巻。
少し持ち直す。

タイトル:山賊ダイアリーSS(1) (イブニングコミックス)
著者:岡本健太郎
出版社:講談社
発行日:2017-07-21

SS1巻。
山あり海ありエンジョイ自然。
オチが好き。ままある。

タイトル:ワンパンマン 14 (ジャンプコミックス)
著者:村田 雄介
出版社:集英社
発行日:2017-08-04

14巻。
サイタマかっこいい巻。

タイトル:ダンジョン飯 5巻 (HARTA COMIX)
著者:九井 諒子
出版社:KADOKAWA / エンターブレイン
発行日:2017-08-10

5巻。
モンスター食らえ。

タイトル:パラレルパラダイス(1) (ヤングマガジンコミックス)
著者:岡本倫
出版社:講談社
発行日:2017-08-04

1巻。
「岡本倫」新刊。
いやほんとこの作者天才だな。
異世界転生ものに偽装したHENTAIコミック。
エロさとアホさがちょうどいい。

タイトル:阿波連さんははかれない 1 (ジャンプコミックス)
著者:水 あさと
出版社:集英社
発行日:2017-08-04

1巻。
阿波連さんかわいいけど、それだけ。

タイトル:絶対に働きたくないダンジョンマスターが惰眠をむさぼるまで 5 (オーバーラップ文庫)
著者:鬼影スパナ
出版社:オーバーラップ
発行日:2017-06-22

1話-最新話(2017/08/06)。
web小説。
序盤が面白い。
異世界転生ものは手探りで主人公が足掻いてるところが楽しい。
後半はまぁまぁ。楽しいけど面白くはない。
http://ncode.syosetu.com/n5490cq/

山上ヶ岳【登山】

修験道登山
奈良の大峰山(山上ヶ岳)を登る。
この前登った稲村ヶ岳の隣の山。

山上ヶ岳
標高1,719m。奈良県吉野郡天川村に位置する。
この一帯は古くから修験道の山として山伏の修行の場であった。道場としての大峯山は、単独の山を指す名前ではなく吉野山から熊野へ続く長い山脈全体を意味している。その中でも山上ヶ岳(旧名:金峯山)の頂上付近には修験道の根本道場である大峯山寺山上蔵王堂があり、山全体を聖域として現在でも女人禁制が維持されている。

行者(仏道・修験道の修行をする人)の道。雰囲気ある。
しかし麓まで一般のバス運行がないのはなぜなのだろう?洞川バス停から行く人はそこそこいるだろうに。

女人結界門↓登山開始。

行者服の人結構いる↓

登山道は長くてしんどい。鎖場は1箇所あったが小学生も登ってるくらいで危険は少ない↓

8合目くらいの修験場。景色が良い。登ってきた道を確認できる↓

大峰山寺↓

山上ヶ岳山頂↓見晴らしはそこそこ良好。ご来光も見られるらしい。

今日もテント泊。
今回はちゃんとしたテント場。
山上ヶ岳山頂から30分ほどに小笹宿という場所。
コケ生した柔らかくて平らなところにテント。前回とはまるで違う良環境。水場も近い。

翌朝割と元気だったので大普賢岳へ行ってから帰ることにする。
が、間違える。すぐ手前のピークを山頂と思い込み引き返してしまう。
大普賢岳の山頂から行者還岳を見ている気でいたが、見てたのは大普賢岳だったという悲劇↓

大普賢岳(手前)からの帰りに竜ヶ岳の山頂を目指す。
割と彷徨ったけど見つけられず。

小笹でテント撤収し帰路。
昨日混雑してた大峰山寺も今朝は静か。

1日目
洞川温泉バス停(9:20)→女人結界門(10:20)→山上ヶ岳(13:30)→小笹宿(15:00)
2日目
小笹宿(6:30)→大普賢岳手前(8:00)→小笹宿(9:30)→大峰山寺(10:30)→女人結界門(13:00)→洞川温泉バス停(14:30)
疲れたけど良いテント泊。久々に天気に恵まれた。