Как экспортировать ваши помеченные элементы из Google Reader

Если ваша реакция на объявленную гибель Google Reader заключалась в том, чтобы кричать «Но мои избранные объекты !», То это руководство для вас. Читайте дальше, поскольку мы покажем вам несколько способов извлечь все ваши избранные статьи из Google Reader.

Почему я хочу это сделать?

Google Reader закрывается 1 июля. Если вы, как и миллионы поклонников RSS по всему миру, были поклонниками Google Reader, есть большая вероятность, что вы использовали функцию звездочки, чтобы пометить статьи, чтобы удержать их, прочитать позже или для каких-либо других целей.

Если вы хотите быть уверены, что все эти помеченные статьи в целости и сохранности, несмотря на надвигающийся взлом Google Reader, вам нужно будет выполнить несколько незначительных шагов, чтобы убедиться, что у вас есть данные, и что вам не придется гнить на Серверы гугл.

Когда вы закончите следовать учебному пособию, у вас будет (как минимум) файл, содержащий все ваши помеченные элементы и (в зависимости от того, с каким сегментом учебного руководства вы хотите следовать вместе) помеченные элементы в более удобной для пользователя форме. дружеский формат.

Однако в этом не может помочь никакая магия экспорта или автоматизации, а именно обработка содержимого помеченных статей. Если вы уже несколько лет играете главную роль для чтения статей позже, вы, вероятно, будете шокированы тем, сколько экспортируемых статей генерирует этот процесс. Возможно, вам просто придется уделять немного времени каждый день на несколько недель, чтобы по крупицам копаться в получающемся дампе.

Экспорт данных Google Reader с помощью Google Takeout

Самый первый заказ для бизнеса — просто получить копию всех ваших данных Google Reader прямо в вашем распоряжении. Таким образом, независимо от того, что произойдет с вашими данными Reader на серверах Google в будущем, у вас будет их копия для работы.

Google Takeout — отличный инструмент для извлечения ваших данных из всех видов сервисов Google, но нам нужен только Reader для этого урока. Посетите подраздел Reader инструмента Google Takeout здесь. Это займет некоторое время, чтобы рассчитать размер файла на вынос. Когда он закончится, нажмите «Создать архив».

Несмотря на то, что он экспортирует не весь аккаунт Google, а лишь его небольшую часть, процесс занимает удивительно много времени. Мы рекомендуем проверить «Напишите мне, когда будете готовы» и собираетесь взять чашку кофе.

Когда все это будет сделано, нажмите кнопку «Загрузить», которая появится в правом нижнем углу.

Идите вперед и распакуйте архив в рабочий каталог, такой как Мои документы, и поместите сам архив в безопасное место. Архивные файлы расположены так:

yourusername@gmail.com-takeout.zip.
.. yourusername@gmail.com-takeout
... Читатель
.... follow.json
.... follow.json
.... понравился.json
.... notes.json
.... расшарено подписчиками.json
.... shared.json
.... starred.json
.... subscription.xml

В архиве есть два типа файлов: JSON и XML. Файлы JSON (нотация объектов JavaScript) — это просто тип формата обмена данными, а файлы XML (расширяемый язык разметки) — удобный способ разметки документа, чтобы его можно было прочитать как на компьютере, так и на человеке. Файл, который нас больше всего интересует для этого урока, — это файл starred.json, поскольку он содержит все записи для ваших помеченных элементов.

Однако в общей схеме освобождения ваших данных из Google Reader и перехода на более зеленые пастбища важен файл subscription.xml. Этот файл содержит все ваши подписки RSS и, если вы хотите импортировать все свои старые подписки из Google Reader в новое приложение RSS, это файл, который вы будете использовать для этого. Обязательно храните его (и оригинальный архив, который вы скачали с Google Takeout) в надежном месте.

Преобразование помеченных элементов в закладки

Один из самых простых способов справиться с файлом JSON — использовать JSONview (расширение, доступное как для Firefox, так и для Chrome). Этот метод лучше всего подходит для читателей с небольшим количеством помеченных элементов в Google Reader (менее 1000).

Установите расширение для соответствующего браузера, а затем просто перетащите файл starred.json на новую панель браузера. Сохраните полученный файл как документ HTML. Затем вы можете повернуть направо и импортировать HTML-документ в выбранный вами веб-браузер, и он будет импортировать все ссылки как новые закладки.

Однако у этой техники есть два недостатка. Во-первых, вы получите несколько дублирующих URL-адресов в файле закладок, так как URL-адрес домена/основного источника статей, которые вы часто отмечали (например, статьи из TutoryBird), будет появляться несколько раз.Это немного раздражает, но не так уж и сложно.

Вторым недостатком является нарушение условий для людей с большим количеством помеченных предметов (те из нас, у кого тысячи и тысячи помеченных предметов); когда имеешь дело с действительно огромным импортом HTML, большую часть времени он просто выпадает и никогда не заканчивается. Очевидно, что это крайне неудовлетворительное решение для опытных пользователей Reader, так как оно никогда не завершает импорт ваших помеченных элементов. Если вы опытный пользователь и вам нужно иметь дело с тысячами помеченных элементов, импортировать их в виде закладок просто невозможно.

Преобразование помеченных элементов в отдельные ссылки (и импорт в Evernote)

Для пользователей, которым требуются большие вычислительные мощности (тип обработки, который может обрабатывать более 5000 элементов со звездой в считанные минуты), мы обращаемся к Python, чтобы помочь нам разобраться в нашем огромном списке.

С разрешения Paul Kerchen и Davide Della Casa, двух опытных пользователей Google Reader, которые хотели экспортировать все свои старые помеченные элементы, у нас есть два очень удобных скрипта Python, которые могут помочь нам сделать одну из двух вещей: 1) преобразовать все записи помеченных элементов в отдельные документы HTML и/или 2) импортировать все наши помеченные элементы в Evernote.

Для обоих приемов вам необходимо установить Python в вашей системе. Возьмите копию Python для вашей операционной системы и установите ее, прежде чем продолжить.

После установки Python перейдите на сайт для проекта экспорта Google Reader в Kerchen/Casa и сохраните файлы export2HTMLFiles.py и export2enex.py в ту же папку, в которую вы распаковали свой файл starred.json.

Если вы хотите преобразовать все свои помеченные элементы в отдельные HTML-файлы, вы можете сделать это с помощью export2HTMLFiles.py, выполнив следующую команду в каталоге, где хранится ваш файл starred.json:

python export2HTMLFiles.py

(Если python не обозначен как общесистемная команда на вашем компьютере, замените «python» на полный путь к исполняемому файлу python, например, C: \ Python2.7 \ python.exe)

В зависимости от количества отмеченных вами элементов этот процесс может занять от нескольких секунд до нескольких минут. Во время нашего теста потребовалось около трех минут, чтобы разорвать 12 000 отмеченных звезд.

Когда это будет сделано, у вас будет ряд пронумерованных и именованных файлов HTML (например, в одной статье вы пометили.html до 10000 другой статье, в которой вы пометили starred.html). Самый простой способ просмотреть их все — просто загрузить локальный каталог в веб-браузер.

Это отличный способ освободить ваши помеченные элементы из Google Reader и файла JSON, но, как мы упоминали ранее в этом руководстве, если вы сохраняете статьи, чтобы прочитать их позже в течение многих лет, у вас будет грандиозная задача по ваши руки.

Одним из способов лучше справиться с этой задачей является использование Evernote в качестве рабочего пространства для сортировки, маркировки и возможного удаления ненужных помеченных элементов.

Есть два способа импортировать элементы в Evernote. Вы можете импортировать файлы HTML, которые мы создали недавно, с помощью папки импорта. В вашем клиенте Evernote для рабочего стола вы можете перейти в Инструменты -> Импорт папок, а затем создать папку дампа для файлов HTML. Мы создали подпапку в папке/Reader/work под названием «Импорт» и новый блокнот в Evernote под названием «Помеченные элементы». Перетаскивая HTML-файлы в папку/Reader/Imports /, мы можем импортировать их как отдельные заметки в папку Evernote Starred Items. Они постоянно хранятся там для проверки на нашем досуге.

В качестве альтернативы, если вы хотите конвертировать все свои помеченные элементы в собственный блокнот Evernote одним махом, вы можете использовать второй загруженный скрипт Python, export2enex.py, чтобы сделать это. Преимущество этого состоит в том, что он немного лучше сохраняет форматирование документов.

В папке, где находится файл starred.json, выполните следующую команду:

python export2enex.py> StarredImport.enex

Возьмите полученный файл StarredImport.enex и импортируйте его в настольный клиент Evernote, используя Файл -> Импорт -> Файлы экспорта Evernote.

К этому моменту вы полностью удалили свои помеченные элементы из Google Reader и готовы приступить к (потенциально длительному) бизнесу по сортировке кучи.

У вас есть умный способ манипулировать файлом JSON и извлекать помеченные элементы? Присоединяйтесь к обсуждению ниже и поделитесь своими советами и хитростями с другими читателями.

Оцените статью
TutoryBird.Ru
Добавить комментарий