Лучший способ включения зависимостей на C/C++ в пакеты Python без необходимости использования средств сборки для конечного пользователя – использование предварительно скомпилированных двоичных файлов (binary wheels) для быстрого паркета (fastparquet), предоставленных на PyPi или через pip install git+(URL).
При создании пакетов Python, которые зависят от кода на C или C++, может возникнуть проблема обеспечения совместимости с различными операционными системами и окружениями. Включение исходного кода или требование сборки из исходников на компьютере конечного пользователя может быть сложной задачей и вызывать трудности у неопытных пользователей или в средах с ограниченными привилегиями.
Однако с появлением двоичных файлов (binary wheels) возникло простое решение этой проблемы. Это предварительно скомпилированные бинарные файлы, которые содержат код на C/C++ и не требуют компиляции на стороне пользователя. Пользователь может легко установить эти файлы из хранилища пакетов PyPi или по ссылке git с помощью pip.
Fastparquet – это отличный пример пакета Python, который использует двоичные файлы для включения своих зависимостей на C. Fastparquet – это библиотека для работы с Parquet файлами, форматом для хранения и обработки структурированных данных. Она предлагает быструю и эффективную обработку больших объемов данных.
Пример использования Fastparquet и предварительно скомпилированных файлов
import fastparquet # Загрузка данных из файла Parquet data = fastparquet.ParquetFile('data.parquet').to_pandas() # Обработка данных processed_data = data.groupby('category').mean() # Сохранение обработанных данных в новый файл Parquet fastparquet.write('processed_data.parquet', processed_data)
Чтобы использовать Fastparquet в своем проекте, вам необходимо установить его с помощью pip. Используйте следующую команду:
pip install fastparquet
Пакет Fastparquet автоматически загрузит предварительно скомпилированные файлы для вашей ОС и архитектуры. Это значительно упрощает установку и использование библиотеки без необходимости настройки среды сборки и компиляции исходного кода.
Если вы хотите использовать последнюю версию Fastparquet или участвовать в разработке проекта, вы также можете установить его из репозитория Git с использованием команды:
pip install git+(URL)
Замените URL на ссылку на репозиторий Git проекта.
Использование предварительно скомпилированных двоичных файлов – это наилучший способ обеспечить простую и надежную установку пакетов Python, которые имеют зависимости на C/C++. Благодаря этому подходу, пользователи смогут без труда устанавливать и использовать пакеты, не задумываясь о сложностях сборки и совместимости.