Лучший способ включения зависимостей на C/C++ в пакеты Python без необходимости использования средств сборки для конечного пользователя

Лучший способ включения зависимостей на C/C++ в пакеты Python без необходимости использования средств сборки для конечного пользователя
Лучший способ включения зависимостей на C/C++ в пакеты Python без необходимости использования средств сборки для конечного пользователя - emilep @ Unsplash

Лучший способ включения зависимостей на C/C++ в пакеты Python без необходимости использования средств сборки для конечного пользователя – использование предварительно скомпилированных двоичных файлов (binary wheels) для быстрого паркета (fastparquet), предоставленных на PyPi или через pip install git+(URL).

При создании пакетов Python, которые зависят от кода на C или C++, может возникнуть проблема обеспечения совместимости с различными операционными системами и окружениями. Включение исходного кода или требование сборки из исходников на компьютере конечного пользователя может быть сложной задачей и вызывать трудности у неопытных пользователей или в средах с ограниченными привилегиями.

Однако с появлением двоичных файлов (binary wheels) возникло простое решение этой проблемы. Это предварительно скомпилированные бинарные файлы, которые содержат код на C/C++ и не требуют компиляции на стороне пользователя. Пользователь может легко установить эти файлы из хранилища пакетов PyPi или по ссылке git с помощью pip.

Fastparquet – это отличный пример пакета Python, который использует двоичные файлы для включения своих зависимостей на C. Fastparquet – это библиотека для работы с Parquet файлами, форматом для хранения и обработки структурированных данных. Она предлагает быструю и эффективную обработку больших объемов данных.

Пример использования Fastparquet и предварительно скомпилированных файлов

import fastparquet

# Загрузка данных из файла Parquet
data = fastparquet.ParquetFile('data.parquet').to_pandas()

# Обработка данных
processed_data = data.groupby('category').mean()

# Сохранение обработанных данных в новый файл Parquet
fastparquet.write('processed_data.parquet', processed_data)
  

Чтобы использовать Fastparquet в своем проекте, вам необходимо установить его с помощью pip. Используйте следующую команду:

pip install fastparquet

Пакет Fastparquet автоматически загрузит предварительно скомпилированные файлы для вашей ОС и архитектуры. Это значительно упрощает установку и использование библиотеки без необходимости настройки среды сборки и компиляции исходного кода.

Если вы хотите использовать последнюю версию Fastparquet или участвовать в разработке проекта, вы также можете установить его из репозитория Git с использованием команды:

pip install git+(URL)

Замените URL на ссылку на репозиторий Git проекта.

Использование предварительно скомпилированных двоичных файлов – это наилучший способ обеспечить простую и надежную установку пакетов Python, которые имеют зависимости на C/C++. Благодаря этому подходу, пользователи смогут без труда устанавливать и использовать пакеты, не задумываясь о сложностях сборки и совместимости.


LetsCodeIt, 14 августа 2023 г., 00:55

Похожие посты

Тесная и слабая связь компонентов программного обеспечения: примеры и влияние на функциональностьУзнайте, может ли скомпилированный код Python конкурировать с C++ в скорости выполнения. Различия в производительностиИспользование паттернов проектирования в Python для создания гибкого и расширяемого кодаНеобходимость docstrings для функций модульных тестов в pep8Реинвентаризация и переписывание ПО: выбор Perl или Python для проектаИспользование хешей коммитов Git и слияние Git между ветками - важные инструменты разработчиковУправление версиями проекта на GitHub: ветви или репозитории?Как проверить подлинность релизных двоичных файлов из репозитория Maven на GitHub?Как обеспечить видимость разработчиков на конкретных модулях проектаИщете лучший способ резервного копирования Git-файлов и проектов? Рассмотрите сервис GitHub для работы с открытым исходным кодом!