Category: it

Category was added automatically. Read all entries about "it".

main

Краткий тест-драйв трёх переводчиков (C.A.T)

А именно:
  • Google Translator Toolkit
  • Deja Vu
  • memoQ

Были ещё OmegaT и Trados, но отпали на ранних стадиях: свободный OmegaT внешне показался слишком любительским (хотя, возможно, к его интерфейсу надо просто привыкнуть), а Trados наоборот слишком монструозным.

У них, правда, есть свои преимущества: OmegaT бесплатен, а Trados -- стандарт для переводчиков (если почитать форумы переводчиков, то можно увидеть немало стенаний на тему "нравится Deja Vu / memoQ, но заказчики обычно требуют Trados").

Collapse )
main

Новости оупенсорса

Вслед за мудаками из Photobucket, мудаки из Livejournal, судя по всему, поменяли разметку, и старый добрый ALJ отказался скачивать нужный мне журнал. И тут внезапно захотелось мне причинить людям радость, нанести им добро и подвергнуть ласке путем написания собственного скрапер с преферансом и куртизанками (благо, при наличии правильного фреймворком работы тут на пару часов). Однако эти чудаки на букву "м" убрали ?format=light и ?usescheme=, хотя данные возможности по-прежнему описаны в руководстве.

Проблему Photobucket думаю решить экспортировав свой ЖЖ и импортировав в Dreamwidth, поправив в процессе ссылки на картинки (типа такого). На Dreamwidth переезжать не хочу, будет как архив блога с работающими картинками. Если куда и перееду, то на автономный блог. Что касается ЖЖ, то писать парсеры для каждого стиля мне чего-то не хочется, а ?style=mine по разным причинам тут не выход. Можно просто по всем ссылкам журнала пройти (как это поисковые боты делают), отбрасывая дубликаты, но топорность такого подход мне не очень нравится. Впрочем, наверное всё же сделаю как-нибудь.

Однако творить добро всё же хочется... и тут я задумался о переводах: перевести что-нибудь не очень большое с помощью современных computer-assisted translation tools (а то я раньше просто в emacs+ord-mode или sublime text переводил), выложить куда-нибудь на gitbook.com и Военный переводчик, попутно овладев нюансами оформления и публикации готовой книги, ну и снискать всяческий народный респект и уважуху.

У меня уже есть заброшенный перевод половины Тотального сопротивления, вторую половину можно закончить достаточно быстро. Хотя, конечно, существует немецкий исходник, более полный и с другими картинками. Было бы неплохо добавить оттуда информацию в перевод, заодно сравнив с советским (если верить введению, то советский перевод со швейцарского руководства от 1987-го и, насколько я помню, некоторые социальные тактики оккупационных войск там опущены -- очень уж они напоминали действия большевиков в 20-30-е). Кроме того, у "Тотального сопротивления" есть несколько малоизвестных продолжений... тоже на немецком, правда.

Ещё один кандидат: "Techniques d'action immédiate" (техники немедленного действия/реагирования, они же battle drills у американцев) из знаменитых "швейцарских методичек" (TM). Хоть и на французском, но он достаточно простой. По крайней мере, с помощью знаний английского и мультитрана я сходу немало ошибок в промтопереводе De 1 a 1000 увидел. Думаю, с помощью заранее подготовленного глоссария и памяти переводов дело быстро пойдёт.

В общем, я решил тут прикинуть, что в мире есть из подходящего инструментария.

Collapse )
main

GTD & App

А ещё мне прислали инвайт из kin.today -- это такой календарь-агрегатор в духе sunrise, выкупленного и убитого закрытого Microsoft. Что дает мне повод немного порассуждать о продуктивности, Getting Things Done и отсутствии идеальных приложений для этого.

Проблема, как мне кажется, в том, что множества функции предусмотренных GTD, предоставляемых приложением и потребных пользователю может и пересекаются, но точно не совпадают. Какие функции нужны, чтобы на самом деле "разобраться с делами"?

Collapse )
main

Folksonomy to Taxonomy

Помощи пост, а то моё google-fu оказалось слабо. Сейчас тема data science очень модная, может кто встречал алгоритмы/фреймворки позволяющие преобразовать плоские списки пользовательских тегов в иерархические таксономии? Конкретно: есть 8000+ книг с тегами, хочется задать им иерархическую классификацию.

Какие хотелки:

1. Построение таксономий непосредственно из фолксономий. В принципе, подобное гуглится:


Там, правда, в лучшем случае псевдокод, а хотелось бы что-нибудь поближе к программированию. В идеале -- reproducible research или мануал.

2. Будет совсем замечательно, если алгоритмы будут не строить таксономию из тегов, а отображать теги на готовую таксономию. Что-то вроде:

Collapse )

Или даже достраивать дерево. То есть, если много книжек по Theoretical Computer Science, чтобы алгоритм там достроил подразделы.

3. Также хотелось бы, чтобы одна книга могла принадлежать нескольким разделам. Например, книга о русско-немецкий войнах с тегами "German History, Military History, Russian History" попала бы в:

  • Humanities & Social Sciences / History / German History
  • Humanities & Social Sciences / History / Military History
  • Humanities & Social Sciences / History / Russian History

Хотя, в принципе, это изыски. Если автоматически разбросать книги по таксономии, то дополнительные классификации можно вручную добавить.
main

Люди в моей голове

В определенном смысле я никогда не умру, потому что частицы моего Я, мои статьи и книги, разлетелись осколками на века, попав на плодородную почву молодых пытливых умов, изменив ход их бытия, и теперь уже непросто провести границу, где они, а где Я. Да и Я — это на самом деле никакой не я, а продукт брожения мозга, читавший определенные книги, слушающий срывающую крышу музыку и так далее по списку. Я же не вещь в себе. Во мне живут осколки тех, кто вспыхнул до меня. И так по эстафете.

-- погибший недавно Николай Лихачев (Крис Касперски)

Ассоциации рождаются из контекста, в котором человек существует. Если один человек прочитал одни книги, а другой – другие, их ассоциации будут разными. А если ассоциации разные, производные от них смыслы будут различаться. И чем сложнее смыслы-производные, тем сильнее будет различие. [...] Язык возможен и без контекстных ассоциаций. Но тогда для выражения отношений понадобится очень много букв. На этом языке будет невозможно обсуждать сложные вещи.

-- Сергей Морозов (ms1970)


Окончание цикла про единоборства будет на следующей неделе, а тут я записал для себя кое-какие мысли, навеянные данным постом. Эта тема интересует давно, но ранее здесь не поднималась. Её можно обозначить следующими ключевыми словами: мозг, когнитивные науки и когнитивный искажения, продуктивность, творчество, flow (состояние потока), самоорганизация и тайм-менеджмент, лайфхаки, биохаки, self-help, личностный рост и т.д. По аналогии с тренировками тела, это можно назвать тренировками ума.

Collapse )
main

XXI век: pro и con

Понадобилось мне тут на днях кое-какие околовоенные вопросы уточнить, зашёл в Defense Technical Information Center (центральный репозиторий МО США для исследований и монографий по оборонным вопроса, более четырёх миллионов документов), ну и не удержавшись накачал за несколько дней примерно тысячу pdf на 4,5Гб.

Иметь тысячу pdf вида a280391.pdf, a524042.pdf, a527325.pdf не очень полезно, поэтому встал вопрос об их автоматическом переименовании. Однако немного подумав, я решил, что раз уж потом всё равно их буду в Calibre сливать (домашняя библиотека электронных книг), то почему бы не проставить метаданные в pdf, из которых Calibre их потом заберёт и заполнит не только поля автора и названия, но и аннотацию с тегами -- благо DTIC отдаёт сразу все метаданные в XML.

В результате написал скрипт и выложил на Github. Это было pro.

Теперь con. Во-первых, с началом событий на Украине доступ к американским околовоенным ресурсам блокируется: приходилось пользоваться прокси и предусмотреть возможность использовать прокси в скрипте (хотя последние несколько дней DTIC почему-то доступен и так). Во-вторых, уже который месяц Роспотребнадзор периодически блокирует Github -- один из важнейших сервисов для разработчиков -- поэтому тоже приходилось пользоваться прокси.

В-третьих, скрипт я писал на Питоне и, при всё богатстве выбора библиотек под него, подходящих инструментов оказалось немного. Большинство библиотек могли метаданных только читать. PyPDF2 мог и писать, но только в старый docinfo, а сейчас метаданные модно хранить в Extensible Metadata Platform. Python XMP Toolkit (питоновская обёртка над Exempi) мог и писать, но работал только под Linux (не страшно) и мог только ОБНОВЛЯТЬ (раз, два) метаданные (что гораздо хуже).

Теперь, похоже, надо найти какую-нибудь консольную утилиту (exiftool?), чтобы добавить всем pdf пустые метаданные и потом уже обработать их скриптом.
main

Новейший американский эсминец "Зумваль" будет управляться Linux

Это давний тренд в мировом производстве оружия: с одной стороны требуется всё большая автоматизация и интеграция (операционные системы встраивают, например, даже в снайперские винтовки), с другой -- сейчас не Холодная война, поэтому необходимо экономить средства. Кроме того, всё больший процент полной стоимости изделия составляют радиоэлектронные компоненты (особенно это верно для крупных и сложных систем). В результате не удивительно, что всё большую популярность у производителей оружия получают распространённые на рынке коммерческие технологии (Commercial off-the-shelf / COTS).

Вот, например, как устроена система управления новейшего американского эсминца "Зумвальт".

Collapse )
main

You made my day!

Серёже Обогуеву не нравятся Unix'ы/Linux'ы, но нравится Mac OS X. А вот здесь он пытается объяснить, почему OS X не Unix:

1. Заглавный текст был написан в 80-х или начале 90-х.

2. Макинтош -- это прежде всего Макинтош (Mac OS), и это главное, а что у него под юбкой и на каких чипах собран BIOS, это мало кого интересует.

3. Не то чтобы после п. 2 это имело большое значение, но под юбкой у Макинтоша система на основе Mach с кучей custom добавлений.

4. Если вам угодно в Макинтоше видеть Unix API, то с примерно таким же успехом можно усматривать его в Windows.

5. По итогу, имеем и поныне, что Unix (напр. FreeBSD) -- система для развлечений программистов, а Windows и Mac -- системы для пользователей.


You, как говорится, made my day!
main

Google Earth + Wikimapia = XXI век

Для просмотра карт обычно использую Google Earth, про Google Maps и Wikimapia знал, но почти не пользовался.

Сегодня прислали ссылку в Wikimapia с описанием одного объекта на карте. Посмотрел, как вообще обстоит с описанием объектов в ней - оказывается весьма и весьма. Перевёл ради интереса на Южную Осетию и обалдел - выделены и подписаны даже отдельные оборонительные позиции осетин (например).

Сразу же встал вопрос об экспорте в Google Earth - оказывается, вполне возможно это сделать через KML/KMZ (Keyhole Markup Language - язык разметки типа XML, KMZ это упакованный zip-ом KML). KML-файл от Wikimapia лежит тут.

В результате получилось следующее:

Collapse )

Поискал ещё слои для GE в интернете, нашёл много забавного, но не очень полезного, типа:

Collapse )
main

Книжное

Давно стараюсь не покупать книг советских/"россиянских" авторов, особенно по истории и гуманитарным наукам. Хлам - поразительный.

Возьмём, например, такую область, как программирование и computer science. Вопреки распространённым в РФ смешным городским легендам из разряда "Россия - страна программистов" или "в Силиконовой долине 2/3 русских", 99% книг русскоязычных авторов это обычная макулатура. Кто не согласен, пусть попробует назвать хотя бы одного специалиста по CS и/или автора книг соответствующей тематики. Обратных примеров сотни - Кнут, Ахо, Хопкрофт, Ульман, Кормен, Ривест, Стивенс, Немет, Уолл, Страуструп, Александреску, Абельсон, Сассман, Таненбаум и т.д. и т.п. Можно перечислять долго, причём это всё ПЕРВОРАНГОВЫЕ имена. Высшая лига.

В РФ нет даже одного человека такого уровня. Всё, что у нас пишут отечественные "мыслители" это как правило кривой, сокращённый, нередко с ошибками перевод и компиляция вышеупомянутых авторов. Соответственно, если кто-то хочет чему-то в CS научиться, тот покупает перевод западного бестселлера (или скачивает из интернета оригинал) и пытается его освоить.

Не трудно понять, что раз уж с программированием дело обстоит таким образом, то с разного рода гуманитарными науками, которые с советских времён опущены ниже плинтуса, дело обстоит ЕЩЁ хуже. Поэтому за редким исключением достойная книга в этой области будет либо переводной, либо дореволюционной.

Собственно, к чему это я. Купил сегодня книжку Казанского П.Е. "Власть всероссийского императора" (1913 год, да) и радуюсь. Хоть она и слегка верноподданическая на мой взгляд, но охват темы, конечно, поразительный.