無精で短気で傲慢なプログラマ

UNIX や web やプログラムの技術的なことを中心に。

技術者・SE・プログラマ面接時の技術的な質問事項

最近、技術者やプログラマの方と面接する機会が多いです。
毎回質問事項を考えるのにも飽きたので、再利用できるようにまとめておきます。

もしさわりの質問に対する反応が良かった場合は、さらに突っ込んだ質問
(インデントが深いもの) をします。経験がないようなら、さらっと流します。

当ページ管理人は、現在 EC サイト構築・運営を担当しているため、
そっち方面に偏っています。

最小限の質問でその人のスキルを見極めるのは難しいなぁ…。

-------
●追記
ホッテントリに載ったようなので、このチャンスに 人材募集 を再アピールしておきます。
興味のある方はぜひ。

念のため言っておきますが、全部できないとダメというつもりは全くありません
(当ページ管理人も、CSS・Eclipse・Struts・Spring・Hibernate・Ruby・アセンブラなど、
弱い部分が多々あります)。

「~はできますか?」「できます」というやりとりがよくあるのですが、「できます」の幅が
広すぎるので、そこを見極めるための材料です。

●追記2
> s-miyashita telnet で ftp って、データ送受は許してくれますよね?:)
passive でデータ送受信まで行えば文句なしです :-D

●追記3
「アルゴリズム」を追加しましたが、イマイチ。その他ちまちまと追加 (★部分)。
-------

・UNIX
 ・使用 OS は何か (FreeBSD/Linux/Solaris/UNIX)
 ・grep/tar/find を使ったことはあるか★
  ・cron 設定をしたことはあるか★
 ・パーミッション (chmod 777, chmod rwx など) の意味★
  ・ディレクトリに対する r/w/x はそれぞれどういう意味を持つか (ファイルに対する
   r/w/x との違いは何か)★
  ・1755・2755・4755 それぞれの意味は何か★
 ・パッケージ管理には何を使っているか
 ・configure からアプリケーションをコンパイルしたことがあるか
 ・共有ライブラリとは何か
 ・シェルの役割を示せ (sh や csh が以下の入力を得た後、何を行うか)★
  ・第一段階: コマンドラインにて ls とタイプしたとき
  ・第二段階: コマンドラインにて ls | sort とタイプしたとき
 ・fork/exec する簡単なシェルを書けるか
  ・子プロセスが親プロセスから引き継ぐもの、引き継がないものを、それぞれ数点あげよ★

・言語
 ・どの言語が好きか。使用している言語のバージョンは(言語共通)★
 ・Perl
  ・どのモジュールが好きか
  ・print と syswrite の違いは何か★
  ・Web フレームワークは何を使っているか
 ・Java
  ・Web フレームワークは何を使っているか
  ・「クラス変数/インスタンス変数/ローカル変数のうち、スレッド
    セーフなのはローカル変数だけである」とはどういう意味か
 ・PHP
  ・Web フレームワークには何を使っているか
  ・PEAR で利用しているパッケージは何か
  ・php.ini で定義できる以下のディレクティブの違いを述べよ。★
   ・default_charset
   ・mbstring.language
   ・mbstring.internal_encoding
   ・mbstring.http_input
   ・mbstring.http_output 
   ・mbstring.encoding_translation
   ・mbstring.detect_order
    → 当ページ管理人は全く覚えてません。
 ・Ruby
  ・Ruby に対する熱い思いのたけを述べよ
 ・C
  ・malloc(3)/realloc(3) にて、動的メモリ管理ができるか
   ・リンクリストを書けるか
   ・malloc したメモリは free すべきか★
  ・fputs(3) と write(2) の違いは何か
  ・可変長引数な関数を記述したことがあるか
  ・Makefile を書けるか
  ・コンパイル・アセンブル・リンクとは何か
  ・二乗を返すマクロ #define MY_POW(x) ((x)*(x)) の問題点は何か★

・コンピュータ基本素養
 ・エンコーディングとは。文字集合とは (ISO-2022-JP と JIS X 0208 を
  説明できるか)
 ・RFC を読んだことはあるか。
 ・テキスト領域とは何か。スタックとは何か。ヒープとは何か。
 ・ブラウザに URL を入力してから、ページが表示されるまで、ブラウザや
  OS が行うステップを示せ (5ステップ以上が望ましい)
 ・BNF (拡張BNF) とは何か。簡単な例をあげよ★

・アルゴリズム★
 ・クイックソートの概要を述べよ
 ・O(n) とはどういう意味か
 ・スパム判定に利用されているベイズの定理とは何か
 ・将棋やチェスなどの思考ルーチンで使用されるミニマックス法とは何か
 ・遺伝的アルゴリズムとは何か
 ・"2+4*(8-1)" などの計算式の答えを出すプログラムを書けるか (字句解析/構文解析)★
 ・有限の在庫と、それを買いたい有限のお客様がいる。お客様は、各在庫に
  ついて欲しい順に順位を付けている。
    お客様A: 1番欲しいのは商品x、2番目に欲しいのは商品y、3番目に…
    お客様B: 1番欲しいのは商品y
    お客様C: 1番欲しいのは商品x、2番目に欲しいのは商品z、3番目に…
  お客様に在庫を割り当てるとして、なるべく多くの在庫を割り当てつつ
  顧客満足を最大にする方法を示せ。ただし 1人のお客様には必ず 2個の
  在庫を引き当てる必要がある (1個は NG。3個以上も NG。0個はアリ)。

  なお、この割り当て作業は毎日実施する。在庫状況や、お客様が指定
  する順位は日々変動する。ある日は「お客様Bには割り当てできず」と
  いう状況もありうる (その場合お客様Bの顧客満足は低下する)。
  顧客満足の定義など不明点はおのおの考えること。
   → 「人材募集」に書いた新規サービスにおいて、こういうことをやります。

・データベース
 ・SQL経験
  ・WHERE 句と HAVING 句と GROUP BY 句の意味と、評価順位は★
  ・CASE・UNION・EXISTS の意味は★
 ・データベース利用経験 (Oracle/MySQL/PostgreSQL/その他)
  ・Oracle であれば、テーブルスペース (表領域) とは何か。エクステントとは何か。
  ・MySQL であれば、MyISAM と InnoDB の違い。
 ・ER図とは何か
 ・正規化とは何か
  ・第一正規形/第二正規形/第三正規形とは何か
 ・ACID 属性とは何か
  ・ヒントとして
   ・Atomicity(原子性)/Consistency(一貫性)/Isolation(独立性)/Durability(永続性)
 ・バックアップ/リストアはできるか
 ・レプリケーションはできるか
 ・トランザクションログとは何か (ロールフォワードとは何か)
 ・トリガ・ビュー・ファンクション・プロシージャ・NOT NULL 以外の制約・参照整合性
  制約(外部キー)とは何か★
  ・上記のものを使うべきか使わざるべきか (DB でやるかアプリでやるか)。また、それはなぜか。
 ・ORマッパとは何か。どのORマッパが好きか

・バッチ系
 ・CSV/固定長ファイルを取り込むことはできるか
 ・メール配信ができるか
 ・EDI連携 (受発注や在庫流通などのデータ連携) はできるか
 ・バッチにて途中でエラー終了した場合、
  ・DB を更新するバッチの場合、後始末として何をすべきか
  ・1000人にメールを送るバッチの場合、後始末として何をすべきか
  ・CSV ファイルを出力するバッチの場合、後始末として何をすべきか

・セキュリティ
 ・外部のセキュリティ診断を受けたことがあるか
 ・SQL インジェクションとは何か。その対策は
 ・XSS 脆弱性とは何か。その対策は
 ・CSRF (クロスサイト・リクエスト・フォージュリ) とは何か。その対策は
 ・暗号化知識
  ・ブロック暗号とは何か
  ・公開鍵暗号とは何か
  ・MD5・SHA とは何か。暗号化と一方向ハッシュの違いは何か
 ・日々のセキュリティ情報をどこから入手しているか★
 ・高木浩光を知っているか★

・HTML/Javascript/CSS
 ・HTML
  ・HTML を書けるか
   ・XML を書けるか
   ・XHTML を書けるか
    ・DTD とは何か
    ・DOCTYPE 宣言とは何か
  ・「HTML 4.0 Transitional では IE は quirk モードになる」の意味がわかるか
  ・実体参照とは何か
  ・META タグとは、「何の」META 情報か。
 ・Javascript を書けるか
  ・Ajax な Javascript を書けるか
  ・Ajax ライブラリを使ったことはあるか (jQuery/prototype.js/script.aculo.us)
  ・DOM (Document Object Model) とは何か
   ・getElementById を使ったことはあるか
   ・appendChild でまっさらな HTML から任意の HTML を動的に生成できるか
 ・CSS
  ・CSS を書けるか
  ・padding と margin の違いは何か
  ・CSS Sprite とは何か
 ・その他
  ・favicon とは何か
  ・URL エンコードとは何か
  ・BASE64 とは何か

・Web アプリケーション
 ・CSVファイルをアップロードし、DB に格納するアプリケーションを作成できるか★
  ・CSVファイルをダウンロードするアプリケーションを作成できるか★
  ・動的画像生成経験★
  ・PDF生成経験★
 ・セッション管理
 ・デザイナとの協業経験
 ・SEO を意識して Web サイトを作成したことがあるか
  ・具体的に何を行ったか、効果測定をしたか
 ・リスティング広告組み込み経験
 ・Google Sitemap
 ・全文検索エンジン利用経験 (Namazu/Hyper Estraier/Senna/Lucene など)
  ・n-gram と形態素解析の違いは何か
 ・負荷計測はできるか
  ・どのような負荷計測ツールを使ったか
  ・どのような考え方で負荷計測をしたか (何をもって合格とするか)
 ・クロスブラウザな Web を作成したことがあるか (IE 以外のブラウザ)

・モバイル
 ・モバイルサイト構築経験
 ・公式サイト構築経験
 ・(いわゆる) 携帯 UID とは
 ・画像表示に関する機種ごとの差異を述べよ
 ・HTML に関する機種ごとの差異を述べよ

・ネットワーク管理
 ・Windows または UNIX マシンを、LAN に接続できるか
 ・DHCP サーバがないとして、PC に何を設定すれば LAN 経由で
  インターネットに出られるか
 ・ルータ設定はできるか
 ・DNSサーバ管理はできるか
 ・DNS サーバの役割は
  ・DNS の正引きとは何か、逆引きとは何か
   ・A レコードとは何か、CNAME レコードとは何か、AAAA レコードとは何か
   ・SPF レコードとは何か
 ・FTP における active/passive とは何か
 ・telnet を起動し、HTTP/SMTP/POP3/FTP サーバとしゃべることができるか
 ・メールサーバ管理経験(sendmail/Postfix/qmail/その他)
  ・携帯宛のメール送信はできるか
   ・その場合の注意点は (PC 宛ではなく、携帯宛の場合で気をつけること)
  ・大量メール配信経験
  ・マルチパートメールを送信できるか
   ・(いわゆる)デコメールの仕組みを述べよ
  ・bounce メール処理はできるか
  ・foo.@exmaple.co.jp というメールアドレスが不正であることを説明せよ。
   ・(送信できない環境の場合) どうしてもこのメールアドレスにメールを
    送信したい場合の方法は。
 ・traceroute の動作原理は
  ・UNIX 系の traceroute と、Windows の tracert コマンドの大きな違いは何か
   (ヒント: ICMP)
 ・NAT (NAPT) とは何か

・プロジェクト管理/構成管理
 ・バージョン管理ツールの使用経験 (CVS/Subversion/Git など)
 ・過去のプロジェクトでは、システムは何環境あったか (開発/テスト/本番など)
 ・複数の環境で整合性を取るため、どのような工夫をしたか
 ・Wiki の利用経験

・インフラ管理
 ・Webサーバ(Apache)
  ・どのようなモジュールを使ったことがあるか
  ・バーチャルホストを設定できるか
  ・SSL
   ・SSL 対応ページを準備するまでの手順を示せ (ヒント: 秘密鍵・CSR)
  ・負荷分散の経験
 ・静的 Web ページを高速化する方法を示せ
  ・Apache における ETag とは何か
 ・Web サイトが重いため、定量的な分析を行ってボトルネックを調査したい。
  具体的にどのようにするか。
   ヒント: ネックになっているのは、DB/アプリケーション/帯域/CPU/HDD
       のいずれかとする。どのような分析をすることで原因を突き止め
       られるか。

スポンサーサイト

PageTop

人材募集その2

2年半ぶりの人材募集です。
興味のある方はぜひ。

人材募集詳細
PageTop

「東京ガス、システム開発失敗で50億円損失」

東京ガスの新規システムが使い物にならず、開発をあきらめて 50億円の
特別損失を計上するとのこと。運用テストの結果、オペレーターが顧客
番号を打ち込んでから顧客データが呼び出されるまでに現状より 40秒
長く時間がかかり、実用化には 30~40億円の追加投資が必要とか。

まぁそれ自体はどうでもいいのだが、気にいらないのはこういう輩。

http://slashdot.jp/comments.pl?sid=300063&cid=875421
結論:このシステムを組んだ奴はデータベースの正しい使い方も知らないド素人

http://slashdot.jp/comments.pl?sid=300063&cid=875436
> まーさーかー、カーソルをループ回して頭から最後まで自前のコードで
> 舐めてるんじゃなかろうな。
そのまさかの可能性がきわめて高い、ということです。

アホか。

大規模システムに関わった経験がないのなら、それはそれで仕方がない
小規模システムがダメで大規模は偉い、というつもりもない。

しかし、そんなことで 30~40億円の追加投資が必要なんてことはありえない
というくらいわからんか。何も知らないくせに中の人を馬鹿にするような
発言をするな。

とりあえずお前が東京ガスに乗り込んで直してこい。それで直せたなら、
10億円くらいは軽く払ってくれるだろうよ。
PageTop

DoCoMo の料金システムは偉い

わたしがすごいなーと思うシステムは NTT DoCoMo の料金システムである。

2005年度 第2四半期データ によると、DoCoMo だけで 5,000万契約ある。

月に一度請求書を送るとすると、5,000万通の請求書を送付しなければ
ならない。もし RDBMS で保持していたとすると、月に 5,000万レコード
ずつ増加することになる。12ヶ月で 6億レコード。

これだけでもため息が出るが、手元にある昔の DoCoMo の請求書を見ると、

基本使用量 (デジタル800/プランA) [月額] 4,500円
いちねん割引料 (契約期間2年超3年まで) [月額] -540円
基本使用量 (パケット/ライフプラン) [月額] 150円
付加機能使用量 (iモード) [月額] 150円
ダイヤル通話分 430円
無料通話分 -430円
延滞利息 34円
消費税相当額 (合計) 213円
(合計) 4,507円

となっている。明細が 8行なので、明細テーブルは 5,000万×8レコードで
4億レコード。月に 4億レコード増える。これは怖い。12ヶ月で 48億レコードである
(まぁ延滞利息については料金計算システムではなく、与信管理システムが算出して
いるような気がするが)。

さらに言えば、何月何日何時何分に何パケット送受信した、というデータも当然管理
しているだろう。これを RDBMS で管理したとするなら、レコード数は 1千億や1兆の
単位になるかもしれない。

ちなみに上記四半期データによると ARPU (Average Revenue Per User。1契約
あたりの月間売上) は 7,000円程度なので、1ヶ月の請求額合計は 350,000,000,000 円
(3,500億円)。

これもデカい。32bit 符号付整数の最大値は 21億なので全然足りない。64bit
符号付整数なら余裕だけれども。

で、これだけでも「デカいシステムだなぁ。RDMBS でまともに管理できるのかなぁ」
って感じなのだが、驚いたのは携帯を解約したとき。窓口に行ったときに、
 「今月の請求額は~円です。ただし直近 2時間程度の料金などは含まれません
  ので、もしそういう通話があれば後日請求させていただきます」
と言われたことである。DoCoMo は2時間程度のタイムラグでリアルタイムに
料金計算をしているのか~と心底感心したものだ。そして解約した月の通話
料金について、どこまで請求して、残りはいくら、という管理ができている
ことにも驚いた。

わたしが経験した範囲では、金が絡むシステムはミスが怖いので、締め日に
月次バッチを動かした後、ある程度手動で検証作業を行ったりするものである。
もしそこでミスが発覚したら、プログラムを修正し再度請求額を計算する。
正確性については、その程度のミスは許容されていた。しかしリアルタイム
性を求めると手動での検証作業はあきらめなければならない。つまりミスは許されない。

DoCoMo の中の実情は知らないが、外から見る限りでは凄いシステムだなぁと
思う。まぁ中身はボロボロだったりするんだろうけれども、外に見せないだけでも
立派だ。
PageTop

fc2 のパスワード

久々にこの blog の管理者ページにログインしようとしたが、パスワードを忘れてしまって
なかなかログインできない。

そういえば「英字は小文字のみ使用可」という仕様だったっけなと思いだして、試して
みたら無事ログインできた。

どうしてこういうわけのわからん仕様にするのだろうか。あとパスワードは 8文字まで
というダメサイトもよくある (goo とか)。

「英大文字なんて使う奴はいないよ」「パスワードなんて 8文字あれば足りるでしょ」と馬鹿が
言い出して、それを疑問に思う人がいなかったか、疑問に思う人はいたけど意見を言う気力が
なかったか、意見を言っても「もう決まっちゃったから」と却下されたのか、と勝手に想像して
同情してみたりする。
PageTop