]> diplodocus.org Git - flac-archive/blobdiff - fa-rip
Start on a script to help rewrite tags en masse.
[flac-archive] / fa-rip
diff --git a/fa-rip b/fa-rip
index b7a4fc0dab568679b17d5a7888606ac63992734d..be1d5ca4ec65f00461325ecabeef382e35473b2f 100755 (executable)
--- a/fa-rip
+++ b/fa-rip
-#! /usr/bin/env perl
-
-# $Id$
-# $URL$
+#!/usr/bin/python
 
 
+"""
 =head1 NAME
 
 B<fa-rip> - rip a CD for B<fa-flacd>
 
 =head1 SYNOPSIS
 
 =head1 NAME
 
 B<fa-rip> - rip a CD for B<fa-flacd>
 
 =head1 SYNOPSIS
 
-B<fa-rip> [B<-d> I<device>] [B<-p> I<post-processor> [B<-t> I<track-count>]
-
-=cut
-
-use strict;
-use warnings;
-
-use Env qw(
-           CDDEV
-);
-
-use Fcntl qw(O_CREAT O_WRONLY);
-use File::Temp;
-use Getopt::Long qw(:config gnu_getopt no_ignore_case);
-use List::Util qw(min);
-use POSIX ':sys_wait_h';
-use Pod::Usage;
-
-use MusicBrainz::Client;
-use MusicBrainz::Queries qw(
-                            MBQ_GetCDTOC
-                            MBE_TOCGetFirstTrack
-                            MBE_TOCGetLastTrack
-                            MBE_TOCGetTrackSectorOffset
-);
-use MusicBrainz::Client::Simple;
-
-sub mkcue {
-    my $device = shift;
-    my $trackcount = shift;
-
-    my $mb = MusicBrainz::Client->new;
-    defined($device) and $mb->set_device($device);
-
-    $mb->query(MBQ_GetCDTOC) or die($mb->get_query_error);
-
-    open(my $fh, '>cue') or die("open('>cue'): $!");
-    print($fh "FILE \"dummy.wav\" WAVE\n");
-    print($fh "  TRACK 01 AUDIO\n");
-    print($fh "    INDEX 01 00:00:00\n");
-
-    my $first = $mb->get_result_data(MBE_TOCGetFirstTrack) + 1;
-    $trackcount = min($trackcount, $mb->get_result_data(MBE_TOCGetLastTrack));
-    # There is frequently (always?) an offset of 150 sectors, so
-    # we'll subtract this offset from each track offset.
-    my $something = $mb->get_result_data1(MBE_TOCGetTrackSectorOffset, 2);
-
-    for my $track ($first .. $trackcount) {
-        my $off = $mb->get_result_data1(MBE_TOCGetTrackSectorOffset, $track+1);
-        $off -= $something;
-
-        my ($minutes,$seconds)=(0,0);
-        my $sectors = $off % 75;
-        if ($off >= 75) {
-            $seconds = $off / 75;
-            if ($seconds >= 60) {
-                $minutes = $seconds / 60;
-                $seconds = $seconds % 60;
-            }
-        }
-
-        printf($fh "  TRACK %02d AUDIO\n", $track);
-        printf($fh "    INDEX 01 %02d:%02d:%02d\n",
-               $minutes, $seconds, $sectors);
-    }
-
-    close($fh) or die("close(>cue): $!");
-
-    return $trackcount;
-}
-
-sub tags_file {
-    my $fn = shift;
-    my $trackcount = shift;
-    my $various = shift;
-    my $artist = shift;
-    my $album = shift;
-    my $release_dates = shift;
-    my $fh;
-    my $i;
-    my $track;
-    my $name;
-
-    open($fh, '>', $fn) or die("open('>$fn'): $!");
-    print($fh 'ARTIST=', (defined($artist) and $artist or ''), "\n");
-    print($fh 'ALBUM=', (defined($album) and $album or ''), "\n");
-
-    if (defined($release_dates) and %$release_dates) {
-        while (my ($country, $date) = each(%$release_dates)) {
-            print($fh "DATE[$country]=$date\n");
-        }
-    } else {
-        print($fh "DATE=\n");
-    }
-
-    for $i (1 .. $trackcount) {
-        $various and print($fh "ARTIST[$i]=\n");
-        if ($track = shift(@_)) {
-            $name = $track->get_name;
-        } else {
-            $name = '';
-        }
-        print($fh "TITLE[$i]=$name\n");
-    }
-
-    close($fh) or die("close(>$fn): $!");
-}
-
-sub tags {
-    my $device = shift;
-    my $trackcount = shift;
-    my $no_mb = shift;
-    my $mb;
-    my @results;
-    my $album;
-    my $i;
-    my $various;
-    my $seen_various;
-
-    tags_file('candidate-tags-0', $trackcount, 0);
-
-    defined($no_mb) and $no_mb and return;
-
-    if (defined($device)) {
-        $mb = new MusicBrainz::Client::Simple (device=>$device);
-    } else {
-        $mb = new MusicBrainz::Client::Simple;
-    }
-
-    @results = $mb->lookup_cd;
-    if (not $mb->success) {
-        die($mb->get_error);
-    }
-
-    for $album (@results) {
-        $i++;
-
-        if ($various = $album->has_various_artists) {
-            if (not $seen_various) {
-                $seen_various = 1;
-                tags_file('candidate-tags-0v', $trackcount, 1);
-            }
-        }
-
-        my %dates = $album->get_release_dates;
-        tags_file("candidate-tags-$i", $trackcount, $various,
-                  $album->get_artist->get_name, $album->get_name,
-                  \%dates, $album->get_tracks);
-    }
-}
-
-sub rip {
-    my $device = shift;
-    my $trackcount = shift;
-
-    $device ||= '/dev/cdrom';
-
-    exec('cdparanoia', '-Bd', $device);
-    # exec prints its own error message so just
-    die;
-}
-
-sub make_post_processor {
-    my $command = shift;
-
-    defined($command) or return;
-
-    sysopen(F, 'post-processor', O_CREAT | O_WRONLY, 0555)
-      or die("sysopen(post-processor, O_CREAT | O_WRONLY, 0555): $!");
-    print(F $command, ' "$@"', "\n");
-    close(F) or die("close(post-processor, O_CREAT | O_WRONLY, 0555): $!");
-}
-
-MAIN: {
-    my $no_mb;
-    my $post_processor;
-    my $trackcount = 99;
-    my $help;
-    my $tempdir;
-
-    GetOptions(
-               'device|d=s' => \$CDDEV,
-               'no-musicbrainz|m' => \$no_mb,
-               'post-processor|p=s', \$post_processor,
-               'tracks|t=i' => \$trackcount,
-               'help|h|?' => \$help,
-              ) or pod2usage();
-    $help and pod2usage(-exitstatus=>0, -verbose=>1);
-
-    # File::Temp::tempdir calls die on error.
-    $tempdir = File::Temp::tempdir('flac-archive.XXXXXXXXXX');
-    chdir($tempdir) or die("chdir($tempdir): $!");
-
-    make_post_processor($post_processor);
-    $trackcount = mkcue($CDDEV, $trackcount);
-    tags($CDDEV, $trackcount, $no_mb);
-    rip($CDDEV, $trackcount);
-}
-
-\f
-__END__
+B<fa-rip> [B<--artist> I<artist> B<--title> I<title>] [B<-d> I<device>] [B<-m>] [B<-p> I<post-processor>] [B<-s>] [B<-t> I<track-count>]
 
 =head1 DESCRIPTION
 
 
 =head1 DESCRIPTION
 
@@ -229,17 +27,32 @@ have to fill out the candidate-tags-0 template.
 
 =over 4
 
 
 =over 4
 
+=item B<--artist> I<artist> B<--title> I<title>
+
+Write candidate-tags files based on I<artist> and album I<title>.
+Useful if you've already ripped wav files with some other program and
+just need to set things up for B<fa-flacd>.
+
 =item B<-d> [B<--device>] I<device>
 
 Use I<device> as the CD-ROM device, instead of the default
 "/dev/cdrom" or the environment variable CDDEV.
 
 =item B<-d> [B<--device>] I<device>
 
 Use I<device> as the CD-ROM device, instead of the default
 "/dev/cdrom" or the environment variable CDDEV.
 
+=item B<-m> [B<--no-musicbrainz>]
+
+Don't connect to MusicBrainz, just write candidate-tags-0.
+
 =item B<-p> [B<--post-processor>] I<post-processor>
 
 Create a "post-processor" file in the temporary directory containing
 the line 'I<post-processor> "$@"'.  See B<fa-flacd>'s man page for
 information about this hook.
 
 =item B<-p> [B<--post-processor>] I<post-processor>
 
 Create a "post-processor" file in the temporary directory containing
 the line 'I<post-processor> "$@"'.  See B<fa-flacd>'s man page for
 information about this hook.
 
+=item B<-s> [B<--single-file>]
+
+Rip whole disc to one wav file and configure B<fa-flacd> to encode it
+to one FLAC file with embedded cuesheet.
+
 =item B<-t> [B<--tracks>] I<track-count>
 
 Archive only the first I<track-count> tracks.  This is handy for
 =item B<-t> [B<--tracks>] I<track-count>
 
 Archive only the first I<track-count> tracks.  This is handy for
@@ -267,10 +80,241 @@ it under the same terms as Perl itself.
 
 =cut
 
 
 =cut
 
-# Local variables:
-# cperl-indent-level: 4
-# perl-indent-level: 4
-# indent-tabs-mode: nil
-# End:
-
-# vi: set tabstop=4 expandtab:
+"""
+
+import os, re, sys, tempfile, time, traceback
+from optparse import OptionParser
+import urllib
+
+import musicbrainz2.disc
+import musicbrainz2.webservice
+
+from org.diplodocus.util import catch_EnvironmentError as c
+
+# http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=439790
+MSF_OFFSET = 150
+
+def mkcue(disc, trackcount=None):
+    fp = c(file, 'cue', 'w')
+    c(fp.write, 'FILE "dummy.wav" WAVE\n')
+
+    if trackcount == None:
+        trackcount = disc.lastTrackNum
+    else:
+        trackcount = min(trackcount, disc.lastTrackNum)
+
+    for i in xrange(disc.firstTrackNum, trackcount+1):
+        offset = disc.tracks[i-1][0]
+        offset -= MSF_OFFSET
+
+        minutes = seconds = 0
+        sectors = offset % 75
+        if offset >= 75:
+            seconds = offset / 75
+            if seconds >= 60:
+                minutes = seconds / 60
+                seconds = seconds % 60
+
+        c(fp.write, '  TRACK %02d AUDIO\n' % (i,))
+        if i == 1 and offset > 0:
+            c(fp.write, '    INDEX 00 00:00:00\n')
+        c(fp.write,
+          '    INDEX 01 %02d:%02d:%02d\n' % (minutes, seconds, sectors))
+
+    c(fp.close)
+
+    return trackcount
+
+def tags_file(fn, trackcount, various, artist=None, album=None,
+              release_dates={}, tracks=[]):
+    fp = c(file, fn, 'w')
+    if various:
+        c(fp.write, 'ALBUMARTIST=')
+    else:
+        c(fp.write, 'ARTIST=')
+    if artist != None:
+        c(fp.write, artist.encode('utf-8'))
+    c(fp.write, '\nALBUM=')
+    if album != None:
+        c(fp.write, album.encode('utf-8'))
+    c(fp.write, '\n')
+
+    have_date = False
+    for (country, date) in release_dates.items():
+        have_date = True
+        c(fp.write, 'DATE[%s]=%s\n' % (country, date))
+    have_date or c(fp.write, 'DATE=\n')
+
+    if len(tracks) > 0:
+        trackcount = min(trackcount, len(tracks))
+    for i in xrange(1, trackcount + 1):
+        artist = title = ''
+        if len(tracks) > 0:
+            track = tracks.pop(0)
+            title = track.title
+            if track.artist:
+                artist = track.artist.name
+        various and c(fp.write, 'ARTIST[%d]=%s\n' % (i,
+                                                     artist.encode('utf-8')))
+        c(fp.write, 'TITLE[%d]=%s\n' % (i, title.encode('utf-8')))
+
+    c(fp.close)
+
+def cover_art(i, asin):
+    url = 'http://images.amazon.com/images/P/%s.01.MZZZZZZZ.jpg' % (asin,)
+    fp = file('cover.front-' + i, 'w')
+    fp.write(urllib.urlopen(url).read())
+    fp.close()
+
+def tags(releases, trackcount):
+    results = []
+    seen_asins = set()
+    seen_various = False
+
+    tags_file('candidate-tags-0', trackcount, False)
+
+    include = musicbrainz2.webservice.ReleaseIncludes(artist=True, tracks=True)
+
+    i = 0
+    for release in releases:
+        i += 1
+        various = not release.isSingleArtistRelease()
+
+        if various and not seen_various:
+            seen_various = True
+            tags_file('candidate-tags-0v', trackcount, various)
+
+        tags_file('candidate-tags-' + str(i), trackcount, various,
+                  release.artist.name, release.title,
+                  release.getReleaseEventsAsDict(),
+                  release.tracks)
+        if release.asin:
+            # See also:
+            # for i in release.getRelations(): print i.type
+            # http://musicbrainz.org/ns/rel-1.0#Wikipedia
+            # ...
+            # http://musicbrainz.org/ns/rel-1.0#AmazonAsin
+            asin = release.asin
+            if asin not in seen_asins:
+                seen_asins.add(asin)
+                cover_art(str(i), asin)
+
+def rip(device, trackcount, single_file):
+    if device == None:
+        device = '/dev/cdrom'
+
+    argv = ['cdparanoia', '-d', device, '1-' + str(trackcount)]
+
+    if single_file:
+        argv.append('wav')
+    else:
+        argv.append('-B')
+
+    c(os.execvp, argv[0], argv)
+
+def make_post_processor(command):
+    if command == None:
+        return
+
+    fd = c(os.open, 'post-processor', os.O_CREAT | os.O_WRONLY, 0555)
+    fp = c(os.fdopen, fd, 'w')
+    c(fp.write, command +' "$@"\n')
+    c(fp.close)
+
+def get_releases(filter_, tries=5):
+    sleep = 1
+    query = musicbrainz2.webservice.Query()
+    while True:
+        try:
+            return query.getReleases(filter_)
+        except musicbrainz2.webservice.WebServiceError, e:
+            if '503' not in e.msg:
+                raise
+            tries -= 1
+            sys.stderr.write('getReleases: %s: ' % e)
+            if tries == 0:
+                sys.stderr.write('giving up\n')
+                raise
+            sleep *= 2
+            sys.stderr.write('sleeping %ds before retry...\n' % sleep)
+            time.sleep(sleep)
+
+def releases_by_disc(disc_id):
+    filter_ = musicbrainz2.webservice.ReleaseFilter(discId=disc_id)
+    return (result.release for result in get_releases(filter_))
+
+def releases_by(q, title, artist=None):
+    filter_ = musicbrainz2.webservice.ReleaseFilter(title=title)
+    results = get_releases(filter_)
+    releases = (result.release for result in results)
+    if artist:
+        pattern = re.sub(r'\s+', r'\s+', artist.strip())
+        releases = (x for x in releases
+                    if re.match(pattern, x.artist.name, re.IGNORECASE))
+    return releases
+
+def main(argv):
+    # Control the exit code for any uncaught exceptions.
+    try:
+        parser = OptionParser()
+        parser.disable_interspersed_args()
+        parser.add_option('--artist')
+        parser.add_option('--discid')
+        parser.add_option('--title')
+        parser.add_option('-d', '--device')
+        parser.add_option('-m', '--no-musicbrainz',
+                          action='store_true', default=False)
+        parser.add_option('-p', '--post-processor')
+        parser.add_option('-s', '--single-file',
+                          action='store_true', default=False)
+        parser.add_option('-t', '--tracks', type='int', default=99)
+    except:
+        traceback.print_exc()
+        return 2
+
+    try:
+        # Raises SystemExit on invalid options in argv.
+        (options, args) = parser.parse_args(argv[1:])
+    except Exception, error:
+        if isinstance(error, SystemExit):
+            return 1
+        traceback.print_exc()
+        return 2
+
+    try:
+        device = options.device
+        trackcount = options.tracks
+
+        tempdir = c((lambda x: tempfile.mkdtemp(prefix=x, dir='.')),
+                    'flac-archive.')
+        sys.stderr.write('ripping to %s\n\n' % (tempdir,))
+        c(os.chdir, tempdir)
+
+        make_post_processor(options.post_processor)
+
+        if options.title != None:
+            tags(releases_by(q, options.title, options.artist), trackcount)
+        elif options.discid != None:
+            tags(releases_by_disc(options.discid), trackcount)
+        else:
+            disc = musicbrainz2.disc.readDisc(device)
+            trackcount = mkcue(disc, trackcount)
+            if options.no_musicbrainz:
+                releases = []
+            else:
+                releases = releases_by_disc(disc.getId())
+            tags(releases, trackcount)
+            rip(device, trackcount, options.single_file)
+    except Exception, error:
+        if isinstance(error, SystemExit):
+            raise
+        # check all print_exc and format_exc in fa-flacd.py; i think
+        # for some i don't do this msg print check
+        sys.stderr.write(getattr(error, 'msg', ''))
+        traceback.print_exc()
+        return 2
+
+    return 0
+
+if __name__ == '__main__':
+    sys.exit(main(sys.argv))