Как использовать блокчейн для хранения информации

По данным PR Newswire объем рынка облачных хранилищ вырастет с 30 млрд долл в 2017 году до 90 млрд долл к 2022 году при годовом темпе роста  24%. Это означает,...

Содержание

#1. Традиционные хранилища данных (CRUD)
#2. Хранилища данных на блокчейне
#3. Варианты использования блокчейна для хранения данных
#4. Хранение всего в блокчейне
#5. Одноранговые файловые системы
#6. Децентрализованные облачные хранилища
#7. Распределенные базы данных
#8. Кейсы: блокчейны для хранения информации
#9. BigChainDB
#10. Storj и Sia
#11. TiesDB
#12. Filecoin
#13. Maidsafe
#14. Последнее слово

По данным PR Newswire объем рынка облачных хранилищ вырастет с 30 млрд долл в 2017 году до 90 млрд долл к 2022 году при годовом темпе роста  24%. Это означает, что данный сектор станет одним из самых быстрорастущих в мировой экономике и блокчейн будет иметь решающее значение для его успеха. И вот почему.

Традиционные хранилища данных (CRUD)

Самый простой способ сохранить информацию в интернете — использовать облачные сервисы, например Google Drive, MySQL и MongoDB. В этом случае пользователь получает доступ к хранилищам компании просто так или в обмен на платную подписку. При этом компания сохраняет контроль над базой данных и предоставляет клиентам право доступа к хранилищам, а также отвечает за безопасность и сохранность данных.

На практике это выглядит следующим образом.

1.    Вы с помощью сайта или десктопного приложения загружаете данные на серверы компании.

2.    Компания вносит сведения в центр обработки данных.

3.    Всякий раз, когда вы хотите получить доступ к загруженной информации, ваше устройство отправляет запрос в центр обработки данных и он предоставляет доступ к информации.

Это стандартная модель, которая доминирует на рынке. У нее два преимущества:

     пользователь может оперировать четырьмя ключевыми функциями: Create, Read, Update и Delete — вместе это называется CRUD;

     пользователь можно быстро загружать и выгружать данные.

В остальном подобные хранилища — это довольно сомнительный способ хранения информации, поскольку, как показывает практика, их часто взламывают, они ненадежны и информация в них используется без ведома и согласия пользователя (в маркетинге).

Именно потому кража персональных данных стала нормой в XXI веке. К примеру, 19 ноября 2018 года власти США опубликовали результаты расследования по делу о краже персональных данных 500 миллионов клиентов гостиничной сети Marriott. Да и краже пикантных фото знаменитостей из iCloud уже никто не удивляется.

Кроме того, использование традиционных способов хранения — прямой путь к монополизации рынка, поскольку чем больше ресурс хранилищ, тем дешевле услуги. А монополизация рынка, как известно, ведет к снижению качества услуг и замедлению темпов научно-технического роста.

Хранилища данных на блокчейне

В основе блокчейна последовательности блоков, каждый из которых несет в себе некий объем информации. Данный объем ограничен фреймворком блокчейна. Например, для Биткоина — это 1 MB. Ограничение показывает максимальный размер файла, который можно загрузить в блокчейн Биткойна. Для хранения информации о транзакциях 1 MB достаточно, однако, если требуется сохранить изображение или видеофайл,  нужно искать другое решение.

Подобным решением теоретически мог бы стать блокчейн Эфириума, поскольку у него нет ограничений на размер блока. Но в этом случае возникает другая проблема — чрезмерно высокая стоимость хранения информации. Дело в том, что загрузка данных в блокчейн Эфириума не бесплатна. На это тратится газ эфириума, который стоит реальных денег, и чем больше размер файла (данных), тем больше этого газа уходит.

В 2017 году подсчитали, что загрузка 1 KB информации в блокчейн обходится пользователям в 2 американских доллара. Выходит, загрузка в блокчейн, например, текстового файла размером в 600 KB обойдется пользователям в 1 200 долл, фильма размером в 5 GB — больше 10 млн долл. Вероятно, сейчас цена существенно ниже, так как рынок просел, но она все еще заоблачная.

Варианты использования блокчейна для хранения данных

Хранение всего в блокчейне

Проблему с ограничением максимального размера блока можно решить несколькими способами. Самый простой из них подразумевает:

1.    Дробление файла на сегменты (осколки), размер которых меньше размера блока. Таким образом, даже самый крупный файл можно записать на блокчейн с небольшим размером блока.

2.    Шифрование данных в осколках, чтобы только их собственник мог понять, что в них записано. Это позволит хранить информацию в открытом блокчейне и быть уверенным в ее конфиденциальности.

3.    Распределение осколков по сети блокчейна. Благодаря этому файл будет сохранен в неизменном виде, пока хотя бы один пользователь синхронизирован с блокчейном.

Этот подход позаимствован у торрент-трекеров, но для хранения данных с помощью блокчейна он не подходит, даже если убрать комиссии за проводку транзакций. Причин для этого несколько. Во-первых, запись информации в блокчейн осуществляется посредством транзакций, а они требуют подтверждения. Большой файл может потребовать несколько тысяч транзакций, то есть нескольких часов, а то и дней.

Во-вторых, информация в блокчейне неизменна. Следовательно, вы не можете удалить или изменить ненужные данные. Все попавшие в сеть файлы и их вариации навсегда останутся в блокчейне, и теоретически кто-то рано или поздно сможет их просмотреть. Например, когда блокчейн потеряет популярность, то и один пользователь сможет единолично им управлять, меняя правила системы как душе угодно.

В-третьих, неизменность приведет к еще одной проблеме — лавинообразному росту размера блокчейна. Если информацию нельзя удалить, она будет только накапливаться, что со временем сделает размер блокчейна слишком большим для обычного пользователя. Например, сейчас размер блокчейна Биткойна –– 220 GB, Эфириума — 600 GB. Это уже слишком много для смартфонов, планшетов и значительной части ноутбуков.

Подытоживая, можно сказать, что хранение информации непосредственно в блокчейне  не лучшая идея, если речь идет о больших данных. Этот вариант подойдет лишь в тех случаях, когда объем информации находится в пределах нескольких килобайт. Например, когда речь идет о финансовых транзакциях, STO, персональных данных или документообороте.

Одноранговые файловые системы

Речь идет о таких способах хранения, как, например, Межпланетная файловая система (IPFS). Эта блокчейн-технология выстроена на протоколе BitTorrent, который подразумевает разбивку файлов на осколки и их хранение в нескольких экземплярах на компьютерах участников системы.

У этого подхода несколько преимуществ:

  • файл будет скачан пользователями, только если он кому-то интересен;
  • популярные файлы скачиваются/раздаются очень быстро;
  •  данные адресно зависимы, поэтому подделать внутреннее содержание файла невозможно;
  • это одноранговое решение (peer-to-peer).

Из недостатков можно отметить, что загрузка файла в сеть происходит, только если пользователь находится  онлайн и такая система обслуживает исключительно статичные данные. Кроме того, получить доступ к файлу можно лишь зная имя/путь к нему.

 

 

Сравнение протоколов HTTP и IPFS

Блокчейн в этой схеме используется в качестве посредника, который связывает участников между собой и отвечает за проверку подлинности и целостности файлов. Кроме того, его можно использовать для монетизации процесса: сиды получают деньги за раздачу файлов, пиры платят за их скачивание.

Децентрализованные облачные хранилища

Это, по сути, обычные облачные хранилища вроде Dropbox. Только данные размещаются не на серверах компаний, а на устройствах пользователей, которые сдают их в аренду. Подобных стартапов много, например Swarm, Storj или Sia.

 

Визуализация процесса выгрузки в Storj

Используя подобные решения не нужно постоянно находиться в сети, чтобы расшаривать информацию другим участникам сети. Достаточно один раз загрузить файл в облачное хранилище.Такие хранилища стабильны, быстры и имеют огромные емкости.

Однако они подходят только для обслуживания статичных данных и не поддерживают поиск по содержанию. Кроме того, они не бесплатны, поскольку люди арендуют оборудование друг у друга.

Распределенные базы данных

Если нужно хранить большие объемы структурированной информации и искать контент по запросам, следует обратить внимание на NoSQL. SQL не подходят, поскольку информация в них не может быть распределена на осколки из-за ограничений эфристичекой теоремы Брюера. Чтобы сделать базу данных по-настоящему распределенной, нужно пожертвовать доступностью и согласованностью.

Именно это делают базы данных NoSQL  — жертвуют согласованностью узлов блокчейна, заменяя ее «eventual consistency» (узлы становятся согласованными спустя определенное время) ради доступности. На основе этого подхода реализовано много проектов, например RethinkDB, Apache Cassandra, MongoDB и другие. И это отличные кейсы — отказоустойчивость, высокая скорость, простая горизонтальная масштабируемость и поддержка богатого языка запросов.

Правда, у них есть один существенный недостаток — все узлы должны доверять друг другу. Это важно, поскольку если среди узлов появится вредоносный элемент, он сможет самостоятельно уничтожить всю базу данных.

Кейсы: блокчейны для хранения информации

BigChainDB

Облачное хранилище с огромным объемом и очень быстрыми транзакциями.  Выстроено на кластере RethinkDB и использует механизмы NoSQL для хранения блоков, благодаря чему  обладает высокой отказоустойчивостью и пропускной способностью.

 

Схема работы BigChainDB

Все участники сети BigChainDB подключены к единому кластеру и имеют полные права на запись, изменение и удаление информации, поэтому данный кейс не подходит для публичных решений. Но его можно использовать для частных корпоративных задач:

     деловодство и юриспруденция;

     бухгалтерская отчетность;

     отслеживание активов;

     финансовые данные.

Storj и Sia

Это компании, которые работают как торговые площадки. Они обещают более дешевое, быстрое и безопасное хранилище. Однако это вовсе не означает, что их услуги дешевле, чем Google, Amazon или DropBox. Просто они получают прибыль не только с арендных ставок, но и с комиссий по проведению транзакций, связанных с загрузкой и извлечением данных.

Схема работы Storj и Sia — это, по сути говоря, посредничество между теми, кто сдает винчестеры в аренду, и теми, кто их арендует. Блокчейн используется для реестра сделок, финансовых расчетов и проверки подлинности файлов в базах данных. При этом данные пользователей хранятся вне фреймворка и могут быть удалены или стать недоступными в любое время, если арендодатели решат удалить файлы или на их стороне случится форс-мажор.

Тем не менее спрос на подобные хранилища постоянно растет, поскольку растет рынок и людям нравится возможность использования новой технологии, даже если они в ней почти ничего не понимают.

TiesDB

Еще одна база данных, где люди сдают винчестеры в аренду. Ее особенность — страховые депозиты, которые арендодатели должны внести на смарт-контракты, чтобы получить доступ к монетизации. Без такого страхового взноса доступна лишь клиентская часть платформы.

Страховой взнос находится внутри смарт-контракта, пока арендодатель не решит уйти, выполнив перед этим все свои обязательства, за которые он получил деньги. Если же арендодатель удалит хранящиеся файлы или просто исчезнет, деньги изымутся из смарт-контракта и распределятся внутри системы. С помощью такого механизма команда TiesDB отсеивает несерьезных и неблагонадежных арендодателей.

 

Сравнение TiesDB, BigChainDB и IPFS

При этом формально TiesDB не является блокчейном, поскольку это просто децентрализованное облачное хранилище, которое использует смарт-контракты для мотивации и наказания участников, а также хранения информации о ставках, взаимных расчетах участников и страховых депозитах.

Кроме того, TiesDB пользуется новым блокчейном для согласования противоречивых сведений о внесении изменений в базу данных и связанных с ними финансовых операций. Например, если сведения о товаре хранятся в базах данных TiesDB, информация о количестве товаров также должна быть внесена в базу данных. Если этого не сделать, покупатель может заплатить за товар, которого больше нет в наличии.

Filecoin

Платформа, в основе которой те же наработки, что и в Storj или Sia. Разница лишь в двух деталях:

     Площадка намерена стимулировать узлы средней емкости, чтобы избежать угрозы централизации со стороны крупных игроков и нестабильности со стороны мелких игроков.

     Система будет стараться найти узлы для хранения данных как можно ближе к пользователям,  арендующим эти узлы. Это позволит увеличить скорость загрузки и выгрузки, а также уменьшит вероятность ошибок во время передачи данных.

С помощью этих нововведений, а также уникального механизма консенсуса,  стимулирующего увеличение дискового пространства в сети, Filecoin намерен обойти Google и Amazon по емкости хранилищ в ближайшие несколько лет.

Maidsafe

Основная идея данного решения —   создание полностью зашифрованной P2P-сети, которая будет являться базой данных для анонимного обмена информацией через зашифрованные слои — как Tor, только для облачных хранилищ. Это станет возможным благодаря трем элементам Maidsafe:

     Self-шифрование: данные, шифрующие сами себя. Когда файл загружается в сетевую структуру Maidsafe, он разбивается на множество небольших осколков, которые самостоятельно зашифровываются и распространяются по сети. В такой форме файл становится нечитаемым для всех, кроме владельца.

     Децентрализованное кэширование данных. Данные в SAFE Network будут храниться по всему миру, а не на серверах одной компании или сети компаний. Это позволит сделать платформу автономной и повысит уровень защищенности информации.

     Доступность данных. Сеть постоянно создает и поддерживает дубликаты всех файлов, которые она хранит. Эта функция ведет к избыточной информации, что должно защитить ее от потери вследствие отключения отдельных узлов.

Последнее слово

При использовании блокчейна для хранения данных важно помнить, что текущие технологии не позволяют хранить большие объемы информации внутри цепочки блоков. Поэтому блокчейн в этой отрасли используется в виде посредника и бухгалтерской книги, которая следит за соблюдением условий сделки по предоставлению хранилища одним человеком другому.

Это означает, что ни блокчейн, ни смарт-контракты, ни криптография не защищают информацию в децентрализованных хранилищах. В данном случае информация имеет ту же защиту, что и  в традиционных хранилищах.

Оцените (5 голосов - 4.8 из 5)
Спасибо!
1
(Ужасно)
2
(Плохо)
3
(Средне)
4
(Хорошо)
5
(Класс!)


Спасибо!