2007-01-01から1年間の記事一覧

Django本出た

お、本の方が先に出た。 http://www.amazon.com/Definitive-Guide-Django-Development-Right/dp/1590597257

Djangoの初めてのリリースバージョンは2.0?

Djangoの初めてのリリースバージョンは2.0になるかもしれないらしい。 Google グループバージョン番号を急にあげるのは、気持ち悪いし印象もあまりよくないので個人的には嫌だ。 リスト上でもRailsを意識してると思われるんじゃないか、というコメントがあっ…

MacでPython3k (or X-MAC-JAPANESE codecの作り方)

Mac使っている人はどうやってPython3kにコンパイルをやってるんでしょうか。とりあえず、下のようにしてからコンパイルすると通る。 詳しい人情報求む。 # http://python.org/download/svn/ $ svn co http://svn.python.org/projects/python/trunk python-sv…

追随

http://use.perl.org/~miyagawa/journal/34461 また真似してUser-Agentの変更とhandlerの指定を出来るようにした。UserAgentの変更がうまくいっているかをdebuglevelが1のHTTPHandlerをつかって 確認する例。 #!/usr/bin/env python2.5 #-*- coding: utf-8 -…

lxml 2.0alpha2 released

http://permalink.gmane.org/gmane.comp.python.lxml.devel/2956 http://codespeak.net/lxml/dev/changes-2.0alpha2.html lxml · PyPI http://codespeak.net/lxml/dev/

Web::Scraper 0.14 released

http://use.perl.org/~miyagawa/journal/34457 また便利になってる。 相対URIは絶対URIに自動変換 (img@src, script@src etc) 便利なショートカット、HTML,RAWの追加 2の方はすでにクリアしてるので1の方はPython版でもlxmlのmake_links_absolute()で自動変…

Scraping Yahoo! Search with Web::Scraper in Python

次はhttp://menno.b10m.net/blog/blosxom/perl/scraping-yahoo-search-with-web-scraper.htmlと同じことをやってみる。比較しやすいようにPerlのコードも並べてみた。 コードの量も見た目もあんまり変わらない。 Perlは括弧がなくてすっきり、Pythonの方はセ…

lxmlメモ

HTMLパースするときにはlxml.htmlを使う etree.parse(url, etree.HTMLParser())みたいにParser明示的に書かなくてもOKだし、便利なメソッドも使える。 etree.parse(URL)と書かず、自分でurlopen & decode parse(URL)と短く書けるようになってるけど、UTF-8じ…

scraperにscraperを渡せるようにした

Web::Scraper の"Twitter Friends (complex)"ができるようになった。 s = scraper( process('span.vcard', people=scraper( process('a', link='@href', name='@title'), process('img', thumb='@src') ) ) ) 下のパッチ加えただけ。 + elif hasattr(val, 's…

Web::Scraper in Python hacks #2: Extract javascript and css content

http://use.perl.org/~miyagawa/journal/34398第二弾。普通にtextで取れた。 s = scraper( process("script", js="text"), )

リストや辞書の中のUnicodeを表示

Google グループ 昨日書いた、「Pythonはリストや辞書の中にある日本語をそのままprintで表示できない」という問題の解決方法が紹介されていました。 print (repr(s.scrape('http://d.hatena.ne.jp/keyword/%BA%B0%CC%EE%A4%A2%A4%B5%C8%FE')).decode('unico…

Web::Scraper in Python hacks #1: Extract links linking to images

http://use.perl.org/~miyagawa/journal/34325の真似をできるようにした。 #!/usr/bin/env python2.5 from scraper import scraper, process import codecs, sys sys.stdout = codecs.getwriter('utf-8')(sys.stdout) s = scraper( process("//a[contains(@h…

Web::Scraper in Python (もしくは scrAPI in Python)

lxml2.0からCSSSelectorが導入されたので、Web::Scraperのようなものを作ってみました。 とりあえず動作するところまでいったので載せておきます。機能はまだ全然足りてないので、簡単なことしかできません。 Python2.5とlxml2.0alpha が必要です。Pythonは…

コメントをさらすユーザースクリプト

ちょっと必要な場面があったので作った。 // ==UserScript== // @name Comment Exposer // @description Make all comments visible // ==/UserScript== (function() { var textnodes = document.evaluate( "//comment()", document, null, XPathResult.UNOR…

Python3000 alpha リリース、そしてインストールが失敗

Python 3.0a1 Release http://python.org/download/releases/3.0/ おめでとうございます。 MacPortsでもすでに用意されているようです。 $ port search python3 python30 lang/python30 3.0a1 An interpreted, object-oriented programming language あ、por…

MySQLのドキュメントの翻訳が酷すぎる

MySQL5以降で SYSDATE() 使うと大抵の場合は遅くなる - ニフラムで消せる相手は自分くらいです 勉強になったけど、引用されている部分日本語おかしくないか? SYSDATE() は、それが実行された時間を戻します。これは NOW() の動作によって異なり、ステートメ…

PHPでDjangoライクなデータベースAPI

を作ったという話ではなく、作りたいなという話。 とりあえずdjango/db/models/base.py あたりからコードリーディング開始。 PythonもDjangoもよく知らないので先は遠い。 QuerySetまで見た。Join絡むともうだめだ。 すなおにDjango使えという声が聞こえた気…

Firemacs

Redirect もうVimperatorは不要。もともとEmacsな人だし。'C-xt' 最初の input/textarea へ移動するといったfirstfield的な機能もある。 キーボードな人はいれるしかない。

Unixコマンド in Python #2 不完全telnet

telnetlibというのがあるらしいのでテスト。 どういうときに便利なんだろうか。 #!/usr/bin/env python import sys import os import telnetlib if len(sys.argv) < 1: sys.stderr.write("error") sys.exit(1) port = 23 if len(sys.argv) == 2: host = sys.…

The Python 3000 PEP Parade まとめ

[Python-3000] PEP Parade PEP 0 -- Index of Python Enhancement Proposals (PEPs) | Python.org Whole Lotta PEPping goin' on (dirtSimple.org) reddit.com S 3101 Advanced String Formatting Talin http://www.python.org/dev/peps/pep-3101/ S 3108 St…

Yet another Rails vs Django

via Marstoon Online http://www.vaporbase.com/rails-django3.35対3.12でRailsの勝ち。 技術面ではDjangoに歩があるが、サポートとかコミュニティーの面で格段にRailsということらしい。この比較、全15章45ページとかなり長い。 DjangoもRailsもあまり知ら…

Emacsでsvn diffするとエラー

Carbon EmacsでC-x v = (vc-diff)するとなぜかエラーが出てこける。 progn: Running svn...FAILED (status 1)最新のCarbon Emacs(GNU Emacs 22.0.97.1 (i386-apple-darwin8.9.1, Carbon Version 1.6.0) of 2007-04-09) にあげてもだめ。Googleで調べても同じ…

Emacs内でIPython

python-modeでIPython使うときにはipython.elが必要。 # ~/site-lispをelisp置き場としている場合 $ cd ~/site-lisp $ wget http://ipython.scipy.org/dist/ipython.el $ vi ~/.emacs # (require 'ipython)を追記 $ emacs これで``C-c C-!``でIPythonが起動…

Revolution OS: GNU, Linux, フリーソフトウェアの歴史についてのドキュメンタリー

OSS

Google Videoから。 英語だけど聞き取りやすい。 リスニングの練習用としても使えるかも。 http://video.google.com/videoplay?docid=7707585592627775409

Firefoxをvimバインディングで操作可能とするエクステンション

reddit経由 http://vimperator.mozdev.net/help.html これはすごい。hjklやC-f C-bででスクロールはもちろん C-nで次のタブに移動 C-pで前のタブに移動uで閉じたタブ開き直し(undo) HLでヒストリバック、フォワードコマンドモードで :[tab]でいろんなコマン…

dotfiles の svn 管理

Developer Enviroments Conference の発表資料 - 2nd life 今さらながらdotfilesをsvnで管理するようにしました。上のリンク先にあったスクリプトはRubyだったのでPythonで書き直し。 元のファイルには'.'をつけたくないので、例えば'zshrc'としてチェックイ…

IPython8.0 日本語Unicode対応完了

IPythonのバージョンがあがったらしいのでアップグレード。 以前あった文字化け問題は解消されたようです。 IPythonのUnicode問題 - rants $ ipython Python 2.4.3 (#1, Nov 4 2006, 21:43:51) Type "copyright", "credits" or "license" for more informati…

Writing Python Extensions

CでPythonのExtensionを書くためのチュートリアルを発見。 http://starship.python.net/crew/mwh/toext/toext.html頭から終わりまで通読して意味が通るように書かれているので http://docs.python.org/ext/ext.htmlよりわかりやすい気がする。 半分くらい読…

python-modeでエラー

http://w.koshigoe.jp/study/?%5Bpython%5Dpython-mode.el%A4%CE%A5%AD%A1%BC%A5%D0%A5%A4%A5%F3%A5%C9 python-modeの機能を一つも使っていないことが発覚。 python-send-buffer便利そうだなと思って試すと Traceback (most recent call last): File "<stdin>", lin</stdin>…

Unixコマンド in Python #1 cat

Pythonになれるために不定期にUnixコマンドをPythonで書いてみることにした。 まずはcat。 #!/usr/bin/env python import sys import fileinput def usage(): sys.stderr.write("Usage: %s [-n] [file ...]\n" % sys.argv[0]) def raw_print(args): for line…