Проект Гутенберг - Project Gutenberg


Из Википедии, свободной энциклопедии
Проект Гутенберг
Проект Gutemberg logo.svg
установленный 1 декабря 1971 ; 47 лет назад (первый документ размещен) ( 1971-12-01 )
Коллекция
Размер Более 57000 документов
Веб-сайт Проект Гутенберг Главная страница
Гутенберг мобильный сайт

Проект Гутенберг ( PG ) является добровольцем попытка оцифровать и архив культурных работ, чтобы «стимулировать создание и распространение электронных книг ». Он был основан в 1971 году американский писатель Майкл С. Харт и является старейшей цифровая библиотека . Большинство предметов в его коллекции полные тексты публичных доменных книг . Проект пытается сделать их как можно более свободными, в долговечных, открытых форматах , которые могут быть использованы практически на любой компьютер. По состоянию на 23 июня 2018 года, Проект Гутенберг достиг 57000 пунктов в своей коллекции бесплатных электронных книг.

Выпуски доступны в виде обычного текста , но везде, где это возможно, другие форматы включены, такие как HTML , PDF , EPUB , MOBI и Plucker . Большинство релизов в английском языке , но многая неанглийская работа также доступна. Есть несколько аффилированных проектов, обеспечивающие дополнительный контент, в том числе региональных и языковых конкретные работ. Проект Гутенберг также тесно связан с распределенным корректоры , в интернет-сообщества для корректуры отсканированных текстов.

история

Майкл Харт (слева) и Григорий Newby (справа) Проект Гутенберг, 2006

Проект Гутенберг был начат Майклом Хартом в 1971 году с оцифровкой США Декларации независимости . Харт, студент в Университете штата Иллинойс , получил доступ к Xerox Sigma V ЭВМ в исследовательской лаборатории материаловедения университета. Через дружественных операторов, он получил счет с практически неограниченным количеством компьютерного времени; его значение в то время с тех пор по- разному оценивается в 100 000 $ или $ 100 млн. Харт сказал , что он хотел «отдать» этот дар, делая что - то , что можно было бы рассматривать как большую ценность. Его первоначальная цель состояла в том, чтобы сделать 10000 с наибольшим количеством вопросов книг , доступных для широкой публики или за небольшую плату, и сделать это в конце 20 - го века.

Этот конкретный компьютер был один из 15 узлов на ARPANET , компьютерной сети , которая стала бы Интернет . Харт полагал , что компьютеры будут один день быть доступными для широкой публики , и решил сделать произведение литературы в электронном виде бесплатно. Он использовал копию США Декларации о независимости в рюкзаке, и это стало первым проектом Гутенберг электронного текста . Он назвал проект после Иоганна Гутенберга , пятнадцатого века немецкого принтера , который продвинул подвижную типа печать нажмите революцию.

К середине 1990-х годов, Харт был запущен Проект Гутенберг из Иллинойса бенедиктинского колледжа . Другие добровольцы присоединились усилия. Весь текст не был введен вручную до 1989 года , когда изображения сканеров и оптического распознавания символов программного обеспечения улучшены и стали более доступными, что делало сканирование книг более осуществимым. Харт позже пришли к соглашению с Carnegie Mellon University , который согласился управлять финансами Проекта Гутенберг. Поскольку объем электронных текстов увеличилось, волонтеры начали принимать операции проекта изо дня в день , что Харт бежать.

Начиная с 2004 года, улучшенный интернет - каталог из содержания проекта Gutenberg легче просматривать, доступ и гиперссылку . Проект Гутенберг теперь организовано Ibiblio в Университете Северной Каролины в Чапел - Хилл .

Итальянский доброволец Pietro Di Miceli разработаны и введены первый веб-сайт проекта Gutenberg и начал разработку интернет-каталога проекта. В своих десяти лет в этой роли (1994-2004), веб-страница проекта получила ряд наград, часто будучи признаками в «лучших из Интернета» списки, и способствуя популярность проекта.

Харт умер 6 сентября 2011 года в своем доме в городе Урбана, штат Иллинойс, в возрасте 64 лет.

Аффилированные организации

В 2000 году некоммерческая корпорация , Проект Гутенберг Литературный архив Foundation, Inc. был основан в Миссисипи , США для обработки правовых потребностей проекта. Пожертвования в нем налог . Давний Проект Гутенберг доброволец Григорий Newby стал первым Фонда генеральный директор .

Также в 2000 году , Чарльз франки основал Распределенные Корректоры (DP), что позволило корректуры отсканированных текстов , которые будут распределены среди многих добровольцев через Интернет. Это усилие значительно увеличилось количество и разнообразие текстов добавляется к Project Gutenberg, а также сделать его более легким для новых добровольцев , чтобы начать вносить. DP стал официально связан с проектом Гутенберг в 2002 году в 2018 году, в 36,000+ DP-способствовали книги составляли почти две трети из почти 57000 книг в Project Gutenberg.

CD и DVD-проект

В августе 2003 г. Проект Гутенберг создал диск , содержащий около 600 из «лучших» электронных книг из коллекции. CD доступен для загрузки в качестве образа ISO . Когда пользователи не могут загрузить компакт - диск, они могут запросить , чтобы иметь копию послал к ним бесплатно.

В декабре 2003 года DVD был создан , содержащий около 10 000 предметов. В то время, это представляло почти всю коллекцию. В начале 2004 года DVD стал доступен по почте.

В июле 2007 года новый выпуск DVD был выпущен, содержащим более 17 000 книг, а в апреле 2010 года, двухслойный DVD был выпущен, содержащим около 30 000 предметов.

Большинство DVD-дисков, и все диски направляемым проекта, были записаны на записываемые носители добровольцами. Тем не менее, новые DVD-диски двухслойные были изготовлены, как оказалось, более экономичны, чем с добровольцы записывались. По состоянию на октябрь 2010 года, проект по почте около 40 тысяч дисков. По состоянию на 2017 год, поставка свободных компакт-дисков было прекращено, хотя образ ISO по-прежнему доступен для скачивания.

Объем сбора

Рост публикаций Проект Гутенберг с 1994 до 2015 года

По состоянию на август 2015 года, Проект Гутенберг утверждал более 57000 пунктов в своей коллекции, в среднем более 50 новых электронных книг добавляемого каждую неделю. Это , прежде всего , произведение литературы от западной культурной традиции . В дополнение к литературе , таких как романы, стихи, рассказы и драмы, Project Gutenberg также кулинарные книги , справочные материалы и вопросы периодических изданий. Коллекция Проекта Гутенберг также имеет несколько нетекстовых элементы , такие как аудио - файлы и музыка обозначение файлы.

Большинство релизов на английском языке, но есть также значительное число во многих других языках. По состоянию на апрель 2016 года, не-английские языки наиболее представлены являются: французский, немецкий, финский, голландский, итальянский и португальский языки.

Всякий раз , когда это возможно, Гутенберг версии доступны в виде обычного текста , в основном с использованием US-ASCII кодировку , но часто распространяется на ISO-8859-1 (необходимы для представления символов с диакритическими знаками на французском и Scharfes s на немецком языке , например). Помимо того , что авторское право бесплатно, требование для латинского ( набора символов ) текстовой версии релиза был критерий Майкла Харта с момента основания проекта Гутенберг, как он считает , что это формат , скорее всего, будет читаться в расширенном будущем , Из необходимости, этот критерий должен быть продлен дополнительно на значительной коллекции текстов на восточно - азиатских языков , таких как китайский и японский сейчас в коллекции, где UTF-8 используется вместо этого.

Другие форматы могут быть освобождены, а при представлении добровольцев. Наиболее распространенный формат не-ASCII является HTML , который позволяет разметки и иллюстрации должны быть включены. Некоторые участники проекта и пользователи запросили более продвинутые форматы, считая их гораздо легче читать. Но некоторые форматы, которые не легко доступны для редактирования, такие как PDF , как правило , не считаются вписываться в цели Проекта Гутенберг. Также Project Gutenberg имеет два варианта основных форматов , которые могут быть представлены (из которых генерируются все остальные файлы): настроенные версии Text Encoding Initiative стандарта (с 2005 года) и ReStructuredText (с 2011 года).

Начиная с 2009 года, каталог проекта Gutenberg начал предлагать автоматически сгенерированных форматы чередовать файлов, включая HTML (если уже не предусмотрено), EPUB и Plucker .

идеалы

Майкл Харт сказал в 2004 году, «Миссия проекта Гутенберг проста:„ Для того, чтобы стимулировать создание и распространение электронных книг“». Его цель состояла в том , «чтобы обеспечить как можно больше электронных книг в различных форматах , как , насколько это возможно для всего мира , чтобы читать как можно больше языков , как это возможно». Кроме того, проект лозунг должен «сломать прутья невежества и безграмотности», потому что волонтеры стремятся продолжать распространение общественной грамотности и признательность за литературное наследие как публичные библиотеки стали делать в конце 19 - го века.

Проект Гутенберг преднамеренно децентрализована. Например, нет никакой политики выбора диктуя, что тексты для добавления. Вместо этого отдельные волонтеры работают на то, что они заинтересованы в том, или есть в наличии. Коллекция Проекта Гутенберг предназначена для сохранения элементов в долгосрочной перспективе, поэтому они не могут быть потеряны ни одного локализованной аварией. В целях обеспечения этого, вся коллекция резервируется регулярно и зеркальная на серверах в разных местах.

авторское право

Проект Гутенберг является тщательно проверить состояние своих электронных книг в соответствии с США об авторском праве . Материал добавлен в архив проекта Gutenberg только после того, как он получил разрешение авторского права, и записи этих разрешений сохраняются для дальнейшего использования. Проект Гутенберг не претендует на авторские права на новые названия он издает. Вместо этого, он поощряет их свободное воспроизведение и распространение.

Большинство книг в коллекции Project Gutenberg распределены общественное достояние в соответствии с США об авторском праве. Есть также несколько защищенных авторским правом тексты, как из научной фантастики автора Кори Доктороу , что Проект Гутенберг распределяет с разрешения. Это могут быть дополнительные ограничения, указанные владельцем авторских прав, хотя они , как правило , как правило, под лицензией Creative Commons .

«Проект Гутенберг» является товарным знаком организации, и знак не может быть использован в коммерческих или модифицированных перераспределениях текстов публичных доменов из проекта. Там нет никаких юридических препятствий для перепродажи работ в общественном достоянии , если все ссылки на Project Gutenberg удалены, но Гутенберг авторы ставят под сомнение целесообразности непосредственно и коммерчески повторное использование контента, отформатированных добровольцами. Там были случаи книг раздевание атрибуции к проекту и продаются с целью получения прибыли в Kindle Store , и других книжных магазинов, один из которых в 1906 книга Fox Траппинг .

С годового сроком авторских наборы США истекают в 2019 году, предметы, опубликованные в 1923 году будут добавлены к общественному достоянию эффективного 1 января 2019.

По состоянию на 28 февраля 2018 года, Проект Гутенберг больше не доступны в Германии в соответствии с постановлением суда от издательства С. Фишера о работах Генриха Манна , Томаса Манна и Дёблин . Несмотря на то, что они были общественным достоянием в Соединенных Штатах, суд признал нарушение авторских прав до сих пор действующих в Германии, и утверждал , что веб - сайт проекта Гутенберг был под немецкой юрисдикцией , поскольку он принимает содержание на немецком языке.

критика

Текстовые файлы используют формат обычного текста , закодированного в UTF-8 и завернутые в 65-70 символов, с пунктами , разделенными перерывом двойной линией. В последние десятилетия, в результате относительно мягкий внешний вид и отсутствие возможности разметки часто воспринимается как недостаток этого формата. Проект Гутенберг пытается решить эту проблему , сделав много текстов доступны в HTML, EPUB и версии PDF , а также, но верность миссии предлагая данные , которые просты в обращении с компьютером код, простой текст ASCII остается наиболее важным форматом, и EPUB версия все еще содержит дополнительные разрывы строк между абзацами.

В декабре 1994 года Проект Гутенберг был раскритикован Initiative Encoding Текста для невключения устройства (документация) решений неизбежных при подготовке текста, или в некоторых случаях, документирование какие из нескольких (конфликтующих) версий текста было один оцифрованы.

Отбор работ (и изданий), доступных была определена по популярности, простота сканирования, будучи из авторского права и других факторов; это было бы трудно избежать в любой толпе-источников проекта.

В марте 2004 года новая инициатива была начата Майкл Харт и Джон С. Guagliardo предоставить недорогие интеллектуальные свойства. Первоначальное название этого проекта было Проект Гутенберг 2 (PG II), который создал споры среди ПГА добровольцев из-за повторным использованием товарного имени проекта для коммерческого предприятия.

Дочерние проекты

Все дочерние проекты являются независимыми организациями , которые разделяют те же идеалы , и дали разрешение на использование Project Gutenberg торговой марки. Они часто имеют определенную национальную или языковую направленность.

Список аффилированных проектов

  • Проект Гутенберг Австралия проводит много текстов , которые являются общественным достоянием в соответствии с австралийским законом об авторском праве , но до сих пор под авторским правом (или неопределенного статус) в Соединенных Штатах, с акцентом на австралийских писателях и книгах об Австралии.
  • Проект Гутенберг Канада .
  • Проект Гутенберг консорциумы Центр является филиалом, специализирующимся в коллекции коллекций. Они не имеют редакционный контроль или последовательное форматирование основного проекта Гутенберг. Тематические сборники, а также многочисленные языки, признаки.
  • Projekt Gutenberg-DE утверждает , авторские права на свою продукцию и ограничивает доступ к просматриваемых веб-версии своих текстов.
  • Проект Гутенберг Европа является проектом в ведении проекта Rastko в Сербии . Она стремится быть Gutenberg Project для всей Европы, и начали размещать свои первые проекты в 2005 году он использует Distributed корректоры программное обеспечение для быстрого получения etexts.
  • Проект Гутенберг Люксембург публикует в основном, но не исключительно, книги, которые написаны в люксембургский .
  • Projekti Lönnrot, проект начал волонтер финского проекта Гутенберга, получил свое название от финского филолога Лённрота (1802-1884)
  • Проект Гутенберг Филиппин стремится «сделать так много книг, доступных как многие люди, насколько это возможно, с особым акцентом на Филиппинах и филиппинских языков».
  • Проект Гутенберг России проект, который направлен на сбор книг общественного достояния в славянских языках, русском, в частности. Обсуждение проекта и его юридической стороны началось в апреле 2012 года Слово Рутенберг представляет собой сочетание слов «Россия» и «Гутенберг».
  • Проект Гутенберг Самопубликация Press, также известная как Project Gutenberg консорциумов Center. В отличии от самого Gutenberg Project, Project Gutenberg Самопубликация позволяет представление текстов никогда не публиковалось, в том числе самоизданных электронных книг. Запущенный в 2012 году, также владеет «gutenberg.us» домен.
  • Проект Гутенберг Тайвань стремится к архиву защищенных авторским правом книги с особым акцентом на Тайване на английском, китайском и Тайвань на основе языков. Это специальный проект Forumosa.com

Смотрите также

Рекомендации

внешняя ссылка