twitterでHTML実体参照を入力したら不思議だった。

別にどうでもいいことなんですけど、どうでもよくないかも知れないけど。笑

Twitter で、  を入力したらスペースに変換(正確には、そのまま。笑)されて表示されているのを発見して、ほんのちょっとだけ試して見ました。

入力したテキストは以下。

&yen; とか < とか &raquo とか &nbsp; とかエスケープされてない?

以下はtwitter for Macでの入力結果。

そして、以下の画像は twitter.com 上での表示。

で以下はtwitter api経由での表示。

¥ とか < とか » とか   とかエスケープされてない?

というわけで、よくわかんないけど、HTML実体参照がエスケープされないということを発見。

リスクがあるのか無いのかは、忙しくて調べる余裕が無いのでだれか教えてください。

twitterの最新のツイートをfacebookに投稿する。

twitterで指定したユーザーの最新のツイートをfacebookのウォールに投稿するPHPスクリプトを作りました。

このアプリのために作りました。

ただーし、実際にこれを動かすには、

  • facebook にアプリケーション登録をする。
  • アクセストークンを取得する。

という一見簡単そうだけど、めっちゃめんどくさい手続きが必要です。

以上が完了したら、以下のスクリプトの”YOUR …”の部分を修正して Cron でぶん回してください。

twitterのユーザー名は、コマンドライン引数で渡すようになっています。

あと、require してるファイルは facebook のPHP 用の SDK です。

Cronには、以下のように渡したほうが幸せになれると思います。

*/10 * * * * export LANG=ja_JP.UTF-8; /usr/bin/php /path/to/cron.php twitter_user

PerlでTwitterのキーワード検索&リツイート(oAuth編)

先日、twitter API の仕様が変更になって、基本認証が使えなくなった。

そのため、以下の記事のスクリプトが動かなくなった。

そこで、oAuthに対応したものをご紹介。

目的

Twitterの検索メモに登録されたキーワードのリストを取得して、タイムラインを検索し、マッチしたものを公式リツイートする。

  • 自分自身の投稿はリツイートしない。
  • RTや@が含まれる投稿はリツイートしない。
  • すでにリツイートした投稿はリツイートしない。
  • ログに保存されたIDより古い投稿はリツイートしない。

アプリケーション登録申請

oAuth認証を行うには以下の情報が必要なので、アプリケーション登録申請を行う。

  • Consumer key
  • Consumer secret
  • Access Token
  • Access Token Secret

登録申請の手順は以下のサイトが分かりやすかった。

実用! PerlでコマンドラインからTwitter投稿(OAuth対応) – perl-mongers.org

ソース

以下のような感じ。
13行目〜17行目を書き換えること。

あとは、Cron等に登録して使用する。

#!/opt/local/bin/perl -wT

#binmode(STDOUT, ":utf8");

use strict;
use Encode;
use Net::Twitter;
use URI::Escape;
use LWP::Simple;
use XML::DOM;

# Config
my $user    = ''; # Twitter のユーザー名
my $key     = ''; # Consumer key
my $secret  = ''; # Consumer secret
my $token   = ''; # Access Token
my $tsecret = ''; # Access Token Secret

my $lang         = 'ja';
my $api          = 'http://search.twitter.com/search.atom';

# do not need to edit
my $max_length      = 140;
my $home;
if (-d $ENV{'HOME'} && $ENV{'HOME'} =~ /^(\/.+)$/) {
    $home = $1;
}
my $log = $home.'/.twitbot.txt'; # 最新のIDを保存して次回以降はこのID以下は無視
if (!-e $log) {
    open (OUT, ">", $log);
    close(OUT);
}

my $max_id = 0;
open (IN, "<", $log);
my $n = <IN>;
if ($n) {
    chomp $n;
    $max_id = $n;
}
close(IN);

# connect to twitter
my $twt = Net::Twitter->new(
    traits => [qw/API::REST OAuth WrapError/],
    consumer_key    => $key,
    consumer_secret => $secret
);

$twt->access_token       ($token);
$twt->access_token_secret($tsecret);

my $sch = $twt->saved_searches();
my %posted;
my $since = $max_id;
foreach (@$sch) {
    my $k = uri_escape_utf8($_->{query});
    my $url = $api.'?show_user=true&q='.$k.'&lang='.$lang;
    my $atom = get($url);
    my $parser = new XML::DOM::Parser;
    my $doc = $parser->parse ($atom);
    my $nodes = $doc->getElementsByTagName ("entry");
    for (my $i=0; $i<$nodes->getLength; $i++) {
        my $node = $nodes->item($i);
        my $txt = getvalue($node, 'title');
        my $id = getvalue($node, 'id');
        if ($id =~ /([0-9]+)$/) {
            $id = $1;
        } else {
            die ('can not get id');
        }
        if ($max_id < $id) {
            $max_id = $id;
        }
        # 以下に該当するものはRTしない
        # 自分の投稿
        # RT(スペース)が含まれる投稿
        # @が含まれる投稿
        # すでにRTした投稿
        # ログに保存されたIDより古い投稿
        if ($txt !~ /^$twitter_user/ && $txt !~ /RT\s/ && $txt !~ /\@/ && !$posted{$id} && $since < $id) {
            $posted{$id} = 1; # 重複投稿しないためのフラグ
            eval {$twt->retweet($id)};
            if ($@) {
                warn "update failed because: ".$@."\n";
            }
        }
    }
}

open (OUT, ">", $log);
print OUT $max_id;
close(OUT);

exit;

sub getvalue {
    my $node = shift @_;
    my $tag = shift @_;
    my $n = $node->getElementsByTagName($tag)->item(0);
    return $n->getFirstChild->getNodeValue;
}

参考

Perlでキーワード検索&公式リツイートを行うbot

ご注意!

ここでご紹介しているスクリプトは、Twitter API の仕様変更により現在は動作しません!(2010/09/06)

以前に書いた記事「キーワード検索したつぶやきをRTするTwitter用bot」で、特定のキーワードにマッチする記事をRTするスクリプトを紹介したが、その後、みなさん御存知の通りTwitterには公式リツイートという仕組みが導入された。

Twitterブログ: リツイート機能を公開しました

というわけで、以前の記事のスクリプトを以下のように修正することで、公式なリツイートに対応できる。

#!/opt/local/bin/perl -wT

#binmode(STDOUT, ":utf8");

use strict;
use Encode;
use Net::Twitter;
use URI::Escape;
use LWP::Simple;
use XML::DOM;

# Config
my $twitter_user = ''; # twitterユーザー名
my $twitter_pass = ''; # twitterパスワード
my $lang         = 'ja';
my $api          = 'http://search.twitter.com/search.atom';

# do not need to edit
my $twt_clientname  = 'twitbot';
my $twt_clientver   = '0.1';
my $twt_clienturl   = 'http://www.theta.ne.jp/';
my $max_length      = 140;
my $home;
if (-d $ENV{'HOME'} && $ENV{'HOME'} =~ /^(\/.+)$/) {
    $home = $1;
}
my $log = $home.'/.twitbot.txt'; # 最新のIDを保存して次回以降はこのID以下は無視
if (!-e $log) {
    open (OUT, ">", $log);
    close(OUT);
}

my $max_id = 0;
open (IN, "<", $log);
my $n = <IN>;
if ($n) {
    chomp $n;
    $max_id = $n;
}
close(IN);

# connect to twitter
my $twt = Net::Twitter->new(
    username    => $twitter_user,
    password    => $twitter_pass,
    clientname  => $twt_clientname,
    clienturl   => $twt_clienturl,
    useragent   => $twt_clientname,
    source   => $twt_clientname,
    clientver   => $twt_clientver,
);

my $sch = $twt->saved_searches();
my %posted;
my $since = $max_id;
foreach (@$sch) {
    my $k = uri_escape_utf8($_->{query});
    my $url = $api.'?show_user=true&q='.$k.'&lang='.$lang;
    my $atom = get($url);
    my $parser = new XML::DOM::Parser;
    my $doc = $parser->parse ($atom);
    my $nodes = $doc->getElementsByTagName ("entry");
    for (my $i=0; $i<$nodes->getLength; $i++) {
        my $node = $nodes->item($i);
        my $txt = getvalue($node, 'title');
        my $id = getvalue($node, 'id');
        if ($id =~ /([0-9]+)$/) {
            $id = $1;
        } else {
            die ('can not get id');
        }
        if ($max_id < $id) {
            $max_id = $id;
        }
        # 以下に該当するものはRTしない
        # 自分の投稿
        # RT(スペース)が含まれる投稿
        # @が含まれる投稿
        # すでにRTした投稿
        # ログに保存されたIDより古い投稿
        if ($txt !~ /^$twitter_user/ && $txt !~ /RT\s/ && $txt !~ /\@/ && !$posted{$id} && $since < $id) {
            $posted{$id} = 1; # 重複投稿しないためのフラグ
#            my $post = 'RT @'.$txt;
#            $post = decode_utf8($post);
#            if (length($post) > $max_length) {
#                $post = substr($post, 0, 137)."...";
#            }
#            print $post."\n";
#            print "----\n";
            eval {$twt->retweet($id)};
            if ($@) {
                warn "update failed because: ".$@."\n";
            }
        }
    }
}

open (OUT, ">", $log);
print OUT $max_id;
close(OUT);

exit;

sub getvalue {
    my $node = shift @_;
    my $tag = shift @_;
    my $n = $node->getElementsByTagName($tag)->item(0);
    return $n->getFirstChild->getNodeValue;
}

twitterでフォローのお礼&フォロー返し

ご注意!

ここでご紹介しているスクリプトは、Twitter API の仕様変更により現在は動作しません!(2010/09/06)

twitter apiでフォローされたらそのメールをsmtpサーバーでキックして、フォロー返し&お礼を送信するbotを作成した。

当初は、cronでやっていたのだが、フォロワー一覧を取得するためのAPIがとても不安定だったのと、複数アカウントに対応するのに負荷を軽減したかったので、メールでキックする方法に変更した。

ちなみに、昨日の時点ではGoogle app engineを使おうと思ったのだが、あっさり気が変わった。

smtpサーバーの設定

今回はpostfixを使用した。
/etc/postfix/main.cfなどで正規表現を使ったエイリアスを設定するのがポイント。

詳細は省きます。

ソース(Perl)

標準入力から渡されたメールをパースして、ユーザー名、フォロワーなどを取得して、フォロー返し&お礼を送信する。

今回はフォローメール以外は何もしていないが、標準入力で渡されたメールをsendmailにパイプで渡せば転送できるような気がする。(スパムフィルターには引っかかるかも。)

複数アカウントに対応していますので、user01という記述がある当たりを修正してください。

あと、スパマーをフォローしないようにタイムゾーンでチェックしていますが、これでは不十分だと思いますので、今後工夫が必要ではないかと思います。

#!/usr/bin/perl -wT

binmode(STDOUT, ":utf8");

use strict;
use warnings;
use Encode;
use Net::Twitter;
use MIME::Parser;

# Config
my %user;
$user{'user01'} = 'pass';
$user{'user02'} = 'pass';
$user{'user03'} = 'pass';

my $tmp = '/tmp';
my $msg = '@%s フォローありがとうございます!よろしくお願いいたします。';
my $twt_clientname  = 'thanksbot';
my $twt_clientver   = '0.1';
my $twt_clienturl   = 'http://www.theta.ne.jp/';
# end config

my @mail = <STDIN>;
my $parser = new MIME::Parser;
$parser->output_dir($tmp);
my $entity = $parser->parse_data(join("", @mail));
my $header = $entity->head;

# get the $uid
my $uid = $header->get("X-Twitterrecipientscreenname");
chomp $uid;

# get the mail type
my $type = $header->get('X-TwitterEmailType');
chomp $type;
if ($type ne 'is_following') {
  exit;
}

# get the sender
my $sender = $header->get('X-Twittersenderscreenname');
chomp $sender;

my $twt = Net::Twitter->new(
   username    => $uid,
   password    => $user{$uid},
   clientname  => $twt_clientname,
   clienturl   => $twt_clienturl,
   useragent   => $twt_clientname,
   source   => $twt_clientname,
   clientver   => $twt_clientver,
);

my $stat = $twt->show_user($sender);
my %st = %$stat;
if ($st{'time_zone'} eq 'Tokyo' || $st{'time_zone'} eq 'Osaka') {
   my $exts = $twt->friendship_exists($uid, $sender);
   if (!$exts) {
       my $post = sprintf($msg, $sender);
       $post = decode_utf8($post);
       if ($twt->create_friend($sender)) {
           $twt->update($post);
       }
   }
}

exit;

もう少しエラー処理とかした方がいいんでしょうけどね。ご愛嬌です。

Google app engineの覚え書き

今回は純粋に個人的な覚書です。

やりたいことは、twitterから送信される「フォローされましたよ」メールを受信して、フォローとお礼をかえすというもので、現状はCronを使用しているのだが、あまりにもtwitterのapiが頻繁にエラーを返すので、その対策としてアプローチを変えようと思った次第。

つまり、メールを受信してキックするようにすれば無駄なapiへのアクセスが減るのではないかと。。。

以下は、関連する情報のURLをだらだらとメモっているだけです。

twitterからのメールのメールヘッダ

How should my bot follow users that follow it or inspect direct messages?

By default, Twitter sends an email the first time a user follows you or sends you a direct message.  For your bot-building pleasure, we’ve added the following headers to those emails

  • X-TwitterEmailType - will be ‘is_following’ or ‘direct_message’
  • X-TwitterCreatedAt - ex: Thu Aug 07 15:17:15 -0700 2008
  • X-TwitterSenderScreenName - ex: ‘bob’
  • X-TwitterSenderName - ex: ‘Bob Smith’
  • X-TwitterSenderID - ex: 12345
  • X-TwitterRecipientScreenName - ex: ‘john’
  • X-TwitterRecipientName - ex: ‘John Doe’
  • X-TwitterRecipientID - ex: 67890
  • X-TwitterDirectMessageID - ex: 2346346

twitter用botを作るときのマナーを考えた。

twitterをビジネスで活用するに当たり、いくつか実稼動させているが、実際に運用していると、一つ間違えればスパムにもなりかねないと思い、自分なりに基準を考えてみた。

実際に以下のようなご意見もあり、それはそれはごもっともなご意見で、謙虚に考える必要があると考えた次第。

UK STUDIO – ついったーBOT作者にお願いしたいこと.

そこで、弊社で作るbotについては、以下のような基準を設けていきたいと思う。

botの運用基準

  1. フォローしてくれる方のタイムラインを占有するような大量のpostを行わない。10分に1件平均ぐらいが妥当ではないかと思う。
  2. 誰かが別の誰か向けに送ったつぶやき(つまり@ユーザー名)やRTが含まれるつぶやきはRTしない。これは、プライバシーに対する配慮として重要であると思う。
  3. テーマを絞って、明確なキーワードでbotを反応させるように気をつける。たとえば、「釣り」というキーワードに反応させるbotを作ってしまうと「お釣り」などの本来関係のないキーワードにも反応してしまうので、こういう抽象的なキーワードで反応させない。
  4. 誤検出には可能な限り改善していく。
  5. クレームなどの対応ができるように連絡先等がわかるようにアカウント上に明記しておく。
  6. RTしてほしくないというユーザーのために、フィルター機能を設けて置く。

特に、タイムラインを占有しないことと、関係のないトピックに対する誤検出をしないようにすることは、緊張感をもって改善して良く必要があるとおもう。

@をつけるかどうかについて

迷いどころなのは、RTする際に@ユーザー名とつけるかどうかであるが、これについては、つけないでRTをすると引用されたご本人に引用したことが伝わりにくく、かえって問題を潜在化させてしまうような気がする。

明確な根拠があるわけでもなく、なんとなくそう思う程度なので自信はないのだが。。。

しばらくは、検索の精度をあげて誤検出を常に改善することと、平均で10分に1件以上のpostをしないように調整していくことで、ご容赦いただきたいと思う。

あと、同じキーワードに反応するbotがすでにある場合は、@はつけないでパーマリンクをつけるのがベターなのかもしれない。(これは悩み中)

2010/07/10 追記

その後Twitterには公式リツイートという機能が実装されたので、上記の問題の多くは改善された。

blockについて

前述したブログでも指摘されているが、たしかにblockしてもらうことを前提にするのは正しくないと思う。

というのが、twitterの検索APIは認証手続きを必要としていないため、botのアカウントをブロックしてもbotからはRTできてしまう。

これは、ブロックした本人にとっては、見えないところでRTされてしまうことを意味している。

したがって、「ブロックしてくれたらいいでしょ?」的な考え方でbotを作るのは大いに問題ありだと思う。

今後

弊社で実運用させているいくつかのお店(お客様)では、botをうまく活用することではっきりとマーケティング上の効果が得られた。

そういう意味で、今後も健全に発展させていきたいと切に願うばかりである。

キーワード検索したつぶやきをRTするTwitter用bot

ご注意!

ここでご紹介しているスクリプトは、Twitter API の仕様変更により現在は動作しません!(2010/09/06)

2010/06/30
このページの情報はもう古いです。
公式リツイートを使いましょう。

twitterのAPIを使用してキーワードにマッチしたつぶやきをRTするbotをperlでつくりました。

出来上がってみれば100行ほどなのですが、半日近くかかってしまいました。

動作環境

以下のPerlモジュールが必要です。

  • Net::Twitter
  • URI::Escape
  • LWP::Simple
  • XML::DOM

Net::Twitterをインストールすれば後は勝手についてくる気もします。
私自身はMacOS 10.6 Snow Leopardで開発して動かしています。

仕様

Twitterサイト上で保存した「検索メモ」を取得して、記事を検索し一致した記事の先頭に「RT @ユーザー名: 」をつけて投稿し直します。

検索はNet::Twiterでもできるのですが、デバッグがやりにくかったので、LWPとDOMを使用してAtomフィードをパースしてます。

記事のIDの最大値をログに保存するようになっており、保存されたIDより古い記事はRTしません。
このログはホームディレクトリ内に「.twitbot.txt」というファイル名で保存されます。

使い方

Cronに登録してご利用ください。

なぜかlang=jaをつけると一定時間以上前の古い投稿が検索されないようです。
また、キーワードごとに15件までしか取得しておりませんので、キーワードによっては、Cronのインターバルを短かくしないと取りこぼしが生じると思います。

ソース

以下に直接ソースを貼りつけておきます。

#!/opt/local/bin/perl -wT

#binmode(STDOUT, ":utf8");

use strict;
use Encode;
use Net::Twitter;
use URI::Escape;
use LWP::Simple;
use XML::DOM;

# Config
my $twitter_user = ''; # twitterユーザー名
my $twitter_pass = ''; # twitterパスワード
my $lang         = 'ja';
my $api          = 'http://search.twitter.com/search.atom';

# do not need to edit
my $twt_clientname  = 'twitbot';
my $twt_clientver   = '0.1';
my $twt_clienturl   = 'http://www.theta.ne.jp/';
my $max_length      = 140;
my $home;
if (-d $ENV{'HOME'} && $ENV{'HOME'} =~ /^(\/.+)$/) {
    $home = $1;
}
my $log = $home.'/.twitbot.txt'; # 最新のIDを保存して次回以降はこのID以下は無視
if (!-e $log) {
    open (OUT, ">$log");
    close(OUT);
}

my $max_id = 0;
open (IN, $log);
my $n = <IN>;
if ($n) {
    chomp $n;
    $max_id = $n;
}
close(IN);

# connect to twitter
my $twt = Net::Twitter->new(
    username    => $twitter_user,
    password    => $twitter_pass,
    clientname  => $twt_clientname,
    clienturl   => $twt_clienturl,
    useragent   => $twt_clientname,
    source   => $twt_clientname,
    clientver   => $twt_clientver,
);

my $sch = $twt->saved_searches();
my %posted;
my $since = $max_id;
foreach (@$sch) {
    my $k = uri_escape_utf8($_->{query});
    my $url = $api.'?show_user=true&q='.$k.'&lang='.$lang;
    my $atom = get($url);
    my $parser = new XML::DOM::Parser;
    my $doc = $parser->parse ($atom);
    my $nodes = $doc->getElementsByTagName ("entry");
    for (my $i=0; $i<$nodes->getLength; $i++) {
        my $node = $nodes->item($i);
        my $txt = getvalue($node, 'title');
        my $id = getvalue($node, 'id');
        if ($id =~ /([0-9]+)$/) {
            $id = $1;
        } else {
            die ('can not get id');
        }
        if ($max_id < $id) {
            $max_id = $id;
        }
        # 以下に該当するものはRTしない
        # 自分の投稿
        # RT(スペース)が含まれる投稿
        # @が含まれる投稿
        # すでにRTした投稿
        # ログに保存されたIDより古い投稿
        if ($txt !~ /^$twitter_user/ && $txt !~ /RT\s/ && $txt !~ /\@/ && !$posted{$id} && $since < $id) {
            $posted{$id} = 1; # 重複投稿しないためのフラグ
            my $post = 'RT @'.$txt;
            $post = decode_utf8($post);
            if (length($post) > $max_length) {
                $post = substr($post, 0, 137)."...";
            }
#            print $post."\n";
#            print "----\n";
            eval {$twt->update($post)};
            if ($@) {
                warn "update failed because: ".$@."\n";
            }
        }
    }
}

open (OUT, "> $log");
print OUT $max_id;
close(OUT);

exit;

sub getvalue {
    my $node = shift @_;
    my $tag = shift @_;
    my $n = $node->getElementsByTagName($tag)->item(0);
    return $n->getFirstChild->getNodeValue;
}

twitterの威力

アクセスが異常に多い

先週末の土曜日、Googleのアクセス解析結果を開いたら、目を疑うようなことが起きていた。

通常、このブログは休日になるとアクセス数が大体半分ぐらいに減るのだが、先週の土曜日は平日の倍以上、普段の土曜日と比べると4倍以上のアクセスがあった。

へ?

と思って詳細をよく調べると、過去に書いたある特定の記事だけ異常にアクセスが多い。

twitterのパワーだった。

そこで、リファラーを調べると、twitterからのアクセスとノーリファラーが非常に多いことがわかった。

どうやら、数千人単位のフォロワーを持っているユーザーの方が、私が書いたしょうもない記事にリンクを貼ってくれたらしい。

ちなみにその記事はこれ。

ちょっと、必要以上に不安な思いをさせる内容だったかもしれないと、反省しつつも、こういうコミュニティサイトの威力と、ブログを書くことに対する責任をちょっと感じてしまった。

マーケティング効果について考え直す

これも先日書いたのだが、最近新聞に広告を出したのだが採算どころか反応は全くのゼロだった。

それと比べると、今回のアクセス数は費用に換算すると計り知れないものがある。

極端な話、新聞広告に払った費用をtwitterユーザーに渡せば、小躍りして何か書いてくれるのではないだろうか?

つくづく、既存のメディアの広告の崩壊を確信してしまった。

atokのその後

Snow Leopardに変えてからatokの調子が悪くなったので、結局アンインストールして、現在は「ことえり」を使っている。

気のせいか、それ以来やたらひらがなが増えた気がする。(苦笑)

でも、やっぱり、あんな機能をデフォルトでONしておくような考え方は納得できないし。。。

twitterのつぶやきを取得して音声出力(MacOS限定)

以下で公開していたソースに「つぶやき」の中に「¥”」という文字を含めることで任意のコマンドが実行できるというセキュリティホールがありました。現在既に修正していますが、万が一すでに試した方は、以下のソースをもとに修正願います。
  • 15行目のダブルクォーテションをシングルクォーテションに変更しました。
  • 49行目の正規表現を修正しました。

ご迷惑をおかけしてすいません。

はじめに!!

以下はMacOSX限定です。
さらに、初めのうちはかなり笑えますが、それ以上のものは得られません。役にも立ちません。

一回目はかなり笑えます。そこだけは保証します。

このスクリプトは?

タイムラインから「つぶやき」を取得して音声で読み上げます。
音声は女性の声ですが、かなり棒読みです。

ところどころ改善の余地はありそうなのですが、それは皆さんにお任せします。

動作環境

  • MacOSX 10.5以上(開発は10.6で行いましたが10.5でも動作するはずです。)
  • Perlおよび以下のPerlモジュール
    • Net::Twitter::Lite
    • XML::DOM
    • LWP::Simple
  • Yahoo日本語形態素解析APIを使用していますので、アプリケーションIDの取得も必要です。
  • SayKana

インストール方法

1)まずはじめに、SayKanaをダウンロードしてインストールしてください。
インストール後は、ドキュメントに従って音声が出力されることをご確認願います。

2)以下のPerlモジュールをインストールしてください。

  • Net::Twiter::Lite
  • XML::DOM
  • LWP::Simple(これはプリインストールかもしれません。)

私の環境では、CPANシェルで問題なくインストールできました。

3)以下のソースをデスクトップ等に設置して、パーミッションを755にしてください。

3)twitterアカウントのアカウント名およびパスワードを12行目および13行目に入力してください。

4)YahooアプリケーションIDを取得して15行目に記述してください。

ソース

#!/usr/bin/perl -wT

undef %ENV;

use strict;
use Encode;
use LWP::Simple;
use Net::Twitter::Lite;
use XML::DOM;

my $twt_user = '';
my $twt_pass = '';
my $yahoo_id = '';
my $api_url = 'http://jlp.yahooapis.jp/MAService/V1/parse?appid=%s&sentence=%s&results=ma';
my $saykana = "/usr/local/bin/saykana '%s'";

my $twt = Net::Twitter::Lite->new(
 username => $twt_user,
 password => $twt_pass
);

my $r = $twt->friends_timeline();

my $n = 0;
foreach (@$r) {
 my $txt = encode_utf8($_->{'text'});
 my $url = sprintf($api_url, $yahoo_id, &enc($txt));
 my $xml = get($url);
 my $kana = &xml2kana($xml);
 print $kana."\n";
 system(sprintf($saykana, $kana));
}

sub enc($) {
 my $str = shift;
 $str =~ s/([^\w ])/'%'.unpack('H2', $1)/eg;
 $str =~ tr/ /+/;
 return $str;
}

sub xml2kana($) {
 my $xml = shift @_;
 my $parser = new XML::DOM::Parser;
 my $doc = $parser->parse ($xml);
 my $list = $doc->getElementsByTagName('reading');
 my @kana;
 for (my $i=0; $i<$list->getLength; $i++) {
 my $text = $list->item($i)->getFirstChild->getNodeValue;
 $text =~ s/'//g;
 if ($text =~ /^[0-9]+$/) {
 $text = "<NUMK VAL=".$text.">";
 } elsif ($text =~ /^\s+$/){
 $text = ',';
 }
 $text =~ s/\//\\\//g;
 push @kana, $text;
 }
 return encode_utf8(join("/", @kana)).",,,";
}

その他

  1. 空白はコンマに変換して一瞬だけスリープが入るようにしています。
  2. つぶやきとつぶやきの間にはコンマを3つ挿入して長めのスリープが入るようにしています。
  3. シングルクォーテションはsaykanaコマンドにおいてアクセントを意味する記号であることとセキュリティ上の配慮により削除しています。

本来は「。」であるが妥当なのですが、テキストエディタで本スクリプトを編集した際にsaykanaコマンドでエラーが出るため、半角の記号で代用しました。(UTF-8-MACによる問題と思われますが、くわしく検証していません。)

(追記)
よく考えたらUTF-8-MACは関係ないかも、いずれにしろJeditで「。」を入力した場合とvimで「。」を入力した場合で何かが違うみたい。(両方ともUTF-8なんですけど。)

ソースをご覧になるとわかりますが、別にtwitterじゃなくても別のものをしゃべらすのも、それほど難しくないので、適当にお楽しみください。

ライセンス

SayKanaおよびYahoo APIのライセンスは厳守していただけますようお願いいたします。

気に入ってくれた方は、ブログ等で紹介してくだされば、十分うれしい限りです。