たゆたふ。

定まる所なく揺れ動き、いろいろやってみたメモ。など

Chcolatyを使ってみた

普段、MacLinux を使っていてあんまり Windows を使う機会が減っているのだが、久々に Windows を触ってみた。

Windows って初期からセットアップしようとするとあちこちからインストーラをダウンロードしてって作業があるので LinuxMac よりめんどくさいと思っていた。 apt や homebrew の様にコマンドラインからソフトをインストールできるという Windows 版パッケージマネージャで以前から気になっていた Chocolatey を試してみた。

インストール

インストールする前に Windows update で最新にしておく。インストールしたばかりの Windows だとそうしないと .NET フレームワークがインストールされていなくて warning が出ることがある。

cmd を管理者モードで起動する https://chocolatey.org/ をブラウザで開き、そこに乗っている次の文字列をコピー&ペーストする。

C:\Windows\system32>@powershell -NoProfile -ExecutionPolicy unrestricted -Command "iex ((new-object net.webclient).DownloadString('https://chocolatey.org/install.ps1'))" && SET PATH=%PATH%;%ALLUSERSPROFILE%\chocolatey\bin

少し時間はかかるが、後は自動的にインストールされる。

インストール後の確認として chocolatey version を実行してみる。 これも若干時間がかかるが次の様な出力が表示されればインストール成功。

C:\Windows\system32>chocolatey version


name          : chocolatey
found         : 0.9.8.27
latestCompare : 000000000000.000000000009.000000000008.000000000027
verMessage    : Latest version installed
latest        : 0.9.8.27
foundCompare  : 000000000000.000000000009.000000000008.000000000027

パッケージのインストール

一度インストールしてしまえば、いろんなソフトウェアが cinst コマンドを使って簡単にインストールできる。

例えば、Git と Ruby をインストールするなら次のコマンドを実行すれば、ダウンロードからインストールの作業が自動的に実行される。

cinst git ruby

これまで、それぞれの配布サイトに行ってインストーラーをダウンロードしていたのと比べるとなんと便利なのだろう。

また、GitHub が開発しているエディタ Atom も今のところ Windows にインストールするには chocorateyを利用することを勧めている

その他にも JDK などもインストールできる。 インストールできるパッケージはChocolatey Software | Packagesで探すことができる。

一度使ってしまうと便利で手放せなくなった。

RubyでExcelファイルをCSVの様に読み込む

集計したいデータが Excel 形式で提供されることがある。 数が少なければ ExcelLibreOffice などで CSV に変換してから扱えばよいが、ファイル数が多いと面倒。

Excel ファイルの読み込みだけで書き込みがない、しかも Ruby で扱うなら、excel2csv が便利。 Excel ファイルを CSV のように読み込むことができる。

インストール

gem で簡単にインストールできる。

gem install excel2csv

もちろん、次の様に Gemfile を作って、Bundler を使っても良い。

gem 'excel2csv'

基本的な使い方

次の様な Excel ファイルを読み込んでみる。

f:id:HeRo:20140920163022p:plain

次のように foreach メソッドで行ごとに読むことができる。

require 'excel2csv'

def read_excel(filename)
  Excel2CSV.foreach(filename) do |row|
    p row
  end
end

read_excel 'sample.xlsx'

実行結果は次の通り。

["cell-A1", "cell-B1", "cell-C1", "cell-D1"]
["cell-A2", "cell-B2", "cell-C2", "cell-D2"]
["cell-A3", "cell-B3", "cell-C3", "cell-D3"]

結合されたセルや、複数シートも読める

次の様に結合されたセルも読み込むことができる。

f:id:HeRo:20140920163121p:plain

結合されたセルは左上のセルに値が入っているものとして扱われ、実行した結果は次の様になる。

["cell-A1", "cell-B1", nil,       nil]
["cell-A2", "cell-B2", "cell-C2", "cell-D2"]
["cell-A3", nil,       "cell-C3", "cell-D3"]
[nil,       nil,       "cell-C4", "cell-D4"]

複数のシートがある場合、デフォルトでは 1 シート目を読むが、foreach メソッドに sheet オプションで指定することで 2 シート目以降も読むことができる。 次の例は 2 シート目を読むこむ例。

require 'excel2csv'

def read_excel(filename)
  Excel2CSV.foreach(filename, sheet:1) do |row|
    p row
  end
end

read_excel 'sample.xlsx'

また、例では xlsx 形式のファイルを使っているが、xls ファイルも問題なく読み込める。