Extend the whole TensorFlow-Lite runtime infrastructure

- TFlite-runtime GPU delegate support - TFlite-runtime external delegate support - ARM Compute Library and ARMnn Delegate - Whisper-TFlite updates.
2025-06-05 22:19:21 +02:00 · 2023-01-25 14:22:22 +01:00
parent 5e277d5e24
commit 876ee82daa
16 changed files with 226 additions and 53 deletions
--- a/buildroot-external/Config.in
+++ b/buildroot-external/Config.in
@ -1,7 +1,9 @@
 menu "Additional drivers, libraries and/or applications"
+	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/armnn/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/baresip/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/btspeaker/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/clog/Config.in"
+	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/compute-library/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/cpuinfo/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/deepfilternet-ladspa/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/docbook-xml/Config.in"
@ -98,6 +100,7 @@ endmenu
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/lottie-qml/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/ncpamixer/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/neon2sse/Config.in"
+	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/opencl_headers/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/openfec/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/openfst/Config.in"
 	source "$BR2_EXTERNAL_OPENVOICEOS_PATH/package/ovos-bus-server/Config.in"
--- a/buildroot-external/configs/rpi3_64-gui_defconfig
+++ b/buildroot-external/configs/rpi3_64-gui_defconfig
@ -543,8 +543,10 @@ BR2_PACKAGE_HOST_PYTHON_SIX=y
 BR2_PACKAGE_HOST_PYTHON_XLRD=y
 BR2_PACKAGE_HOST_RUSTC=y
 BR2_PACKAGE_HOST_RUST=y
+BR2_PACKAGE_ARMNN=y
 BR2_PACKAGE_BARESIP=y
 BR2_PACKAGE_BTSPEAKER=y
+BR2_PACKAGE_COMPUTE_LIBRARY=y
 BR2_PACKAGE_DEEPFILTERNET_LADSPA=y
 BR2_PACKAGE_FANN=y
 BR2_PACKAGE_GROWDISK_SERVICE=y
--- a/buildroot-external/configs/rpi4_64-gui_defconfig
+++ b/buildroot-external/configs/rpi4_64-gui_defconfig
@ -543,8 +543,10 @@ BR2_PACKAGE_HOST_PYTHON_SIX=y
 BR2_PACKAGE_HOST_PYTHON_XLRD=y
 BR2_PACKAGE_HOST_RUSTC=y
 BR2_PACKAGE_HOST_RUST=y
+BR2_PACKAGE_ARMNN=y
 BR2_PACKAGE_BARESIP=y
 BR2_PACKAGE_BTSPEAKER=y
+BR2_PACKAGE_COMPUTE_LIBRARY=y
 BR2_PACKAGE_DEEPFILTERNET_LADSPA=y
 BR2_PACKAGE_FANN=y
 BR2_PACKAGE_GROWDISK_SERVICE=y
--- a/buildroot-external/package/armnn/Config.in
+++ b/buildroot-external/package/armnn/Config.in
@ -0,0 +1,11 @@
+config BR2_PACKAGE_ARMNN
+	select BR2_PACKAGE_COMPUTE_LIBRARY
+	select BR2_PACKAGE_TENSORFLOW_LITE
+	bool "armnn"
+	help
+	  Arm NN is the most performant machine learning (ML) 
+	  inference engine for Android and Linux, accelerating 
+	  ML on Arm Cortex-A CPUs and Arm Mali GPUs. 
+
+	  https://github.com/ARM-software/armnn
+
--- a/buildroot-external/package/armnn/armnn.mk
+++ b/buildroot-external/package/armnn/armnn.mk
@ -0,0 +1,34 @@
+################################################################################
+#
+# armnn
+#
+################################################################################
+
+ARMNN_VERSION = v22.11.01
+ARMNN_SITE = $(call github,ARM-software,armnn,$(ARMNN_VERSION))
+ARMNN_LICENSE = MIT
+
+ARMNN_INSTALL_STAGING = YES
+ARMNN_DEPENDENCIES = host-pkgconf compute-library tensorflow-lite
+ARMNN_SUPPORTS_IN_SOURCE_BUILD = NO
+
+ARMNN_CONF_OPTS = \
+	-DCMAKE_C_FLAGS="$(TARGET_CFLAGS) -fPIC -Wno-error=missing-field-initializers" \
+	-DCMAKE_CXX_FLAGS="$(TARGET_CXXFLAGS) -fPIC -Wno-error=missing-field-initializers" \
+	-DCMAKE_SHARED_LINKER_FLAGS="$(TARGET_LDFLAGS) -fPIC -Wno-error=missing-field-initializers" \
+	-DCMAKE_POSITION_INDEPENDENT_CODE=ON \
+	-DBUILD_SHARED_LIBS=ON \
+	-DBUILD_TF_LITE_PARSER=1 \
+	-DBUILD_ARMNN_TFLITE_DELEGATE=ON \
+	-DARMCOMPUTENEON=ON \
+	-DARMCOMPUTECL=1 \
+	-DARMNNREF=1 \
+	-DARMCOMPUTE_ROOT="$(BUILD_DIR)/compute-library-$(COMPUTE_LIBRARY_VERSION)" \
+	-DARMCOMPUTE_BUILD_DIR="$(BUILD_DIR)/compute-library-$(COMPUTE_LIBRARY_VERSION)/buildroot-build" \
+	-DTENSORFLOW_ROOT="$(BUILD_DIR)/tensorflow-lite-$(TENSORFLOW_LITE_VERSION)" \
+	-DTF_LITE_SCHEMA_INCLUDE_PATH="$(BUILD_DIR)/tensorflow-lite-$(TENSORFLOW_LITE_VERSION)/tensorflow/lite/schema" \
+	-DTFLITE_LIB_ROOT="$(STAGING_DIR)/usr/lib" \
+	-DTfLite_Schema_INCLUDE_PATH="$(BUILD_DIR)/tensorflow-lite-$(TENSORFLOW_LITE_VERSION)/tensorflow/lite/schema" \
+	-DTfLite_LIB="$(STAGING_DIR)/usr/lib/libtensorflow-lite.so"
+
+$(eval $(cmake-package))
--- a/buildroot-external/package/compute-library/Config.in
+++ b/buildroot-external/package/compute-library/Config.in
@ -0,0 +1,9 @@
+config BR2_PACKAGE_COMPUTE_LIBRARY
+	bool "compute-library"
+	help
+	  The Compute Library is a set of computer vision and 
+	  machine learning functions optimised for both Arm CPUs 
+	  and GPUs using SIMD technologies.
+
+	  https://github.com/ARM-software/ComputeLibrary
+
--- a/buildroot-external/package/compute-library/compute-library.mk
+++ b/buildroot-external/package/compute-library/compute-library.mk
@ -0,0 +1,65 @@
+################################################################################
+#
+# compute-library
+#
+################################################################################
+
+COMPUTE_LIBRARY_VERSION = v22.11
+COMPUTE_LIBRARY_SITE = $(call github,ARM-software,ComputeLibrary,$(COMPUTE_LIBRARY_VERSION))
+COMPUTE_LIBRARY_LICENSE = MIT
+COMPUTE_LIBRARY_LICENSE_FILES = LICENSE
+COMPUTE_LIBRARY_INSTALL_STAGING = YES
+
+COMPUTE_LIBRARY_DEPENDENCIES = \
+	host-scons \
+	host-pkgconf
+
+COMPUTE_LIBRARY_LDFLAGS = "$(TARGET_LDFLAGS)"
+COMPUTE_LIBRARY_CFLAGS = " $(TARGET_CFLAGS)"
+COMPUTE_LIBRARY_CXXFLAGS = "$(TARGET_CXXFLAGS)"
+
+COMPUTE_LIBRARY_SCONS_ENV = $(TARGET_CONFIGURE_OPTS)
+
+COMPUTE_LIBRARY_SCONS_OPTS = \
+	arch=arm64-v8a \
+	Werror=0 \
+	debug=0 \
+	asserts=0 \
+	neon=1 \
+        os=linux \
+	examples=0 \
+	build=cross_compile \
+	toolchain_prefix="" \
+	embed_kernels=1 \
+	extra_cxx_flags="-fPIC"
+
+COMPUTE_LIBRARY_SCONS_ENV += \
+	LDFLAGS=$(COMPUTE_LIBRARY_LDFLAGS) \
+	CFLAGS=$(COMPUTE_LIBRARY_CFLAGS) \
+	CCFLAGS=$(COMPUTE_LIBRARY_CFLAGS) \
+	CXXFLAGS=$(COMPUTE_LIBRARY_CXXFLAGS)
+
+define COMPUTE_LIBRARY_BUILD_CMDS
+	(cd $(@D); \
+	$(COMPUTE_LIBRARY_SCONS_ENV) \
+	$(SCONS) \
+	$(COMPUTE_LIBRARY_SCONS_OPTS))
+endef
+
+define COMPUTE_LIBRARY_INSTALL_STAGING_CMDS
+	(cd $(@D); \
+	$(COMPUTE_LIBRARY_SCONS_ENV) \
+	$(SCONS) \
+	$(COMPUTE_LIBRARY_SCONS_OPTS) \
+	install_dir="$(STAGING_DIR)/usr")
+endef
+
+define COMPUTE_LIBRARY_INSTALL_TARGET_CMDS
+	(cd $(@D); \
+	$(COMPUTE_LIBRARY_SCONS_ENV) \
+	$(SCONS) \
+	$(COMPUTE_LIBRARY_SCONS_OPTS) \
+	install_dir="$(TARGET_DIR)/usr")
+endef
+
+$(eval $(generic-package))
--- a/buildroot-external/package/opencl_headers/Config.in
+++ b/buildroot-external/package/opencl_headers/Config.in
@ -0,0 +1,6 @@
+config BR2_PACKAGE_OPENCL_HEADERS
+	bool "opencl_headers"
+	help
+	  Header-only library for Khronos OpenCL-Headers.
+
+	  https://github.com/KhronosGroup/OpenCL-Headers
--- a/buildroot-external/package/opencl_headers/opencl_headers.hash
+++ b/buildroot-external/package/opencl_headers/opencl_headers.hash
@ -0,0 +1 @@
+sha256  ca8090359654e94f2c41e946b7e9d826253d795ae809ce7c83a7d3c859624693  opencl_headers-dcd5bede6859d26833cd85f0d6bbcee7382dc9b3.tar.gz
--- a/buildroot-external/package/opencl_headers/opencl_headers.mk
+++ b/buildroot-external/package/opencl_headers/opencl_headers.mk
@ -0,0 +1,23 @@
+################################################################################
+#
+# opencl_headers
+#
+################################################################################
+
+OPENCL_HEADERS_VERSION = dcd5bede6859d26833cd85f0d6bbcee7382dc9b3
+OPENCL_HEADERS_SITE = $(call github,KhronosGroup,OpenCL-Headers,$(OPENCL_HEADERS_VERSION))
+OPENCL_HEADERS_LICENSE = BSD-2-Clause
+OPENCL_HEADERS_LICENSE_FILES = LICENSE
+
+OPENCL_HEADERS_SUPPORTS_IN_SOURCE_BUILD = NO
+OPENCL_HEADERS_DEPENDENCIES = psimd
+
+OPENCL_HEADERS_CONF_OPTS = -DCMAKE_SYSTEM_NAME=Linux \
+		 -DCMAKE_SYSTEM_PROCESSOR=aarch64 \
+		 -DOPENCL_HEADERS_BUILD_TESTING=OFF \
+		 -DOPENCL_HEADERS_BUILD_CXX_TESTS=OFF
+
+OPENCL_HEADERS_INSTALL_STAGING = YES
+OPENCL_HEADERS_INSTALL_TARGET = NO
+
+$(eval $(cmake-package))
--- a/buildroot-external/package/tensorflow-lite/Config.in
+++ b/buildroot-external/package/tensorflow-lite/Config.in
@ -16,6 +16,8 @@ config BR2_PACKAGE_TENSORFLOW_LITE
        select BR2_PACKAGE_NEON2SSE
        select BR2_PACKAGE_RUY
 	select BR2_PACKAGE_XNNPACK
+	select BR2_PACKAGE_OPENCL_HEADERS
+	select BR2_PACKAGE_VULKAN_HEADERS
        help
          Tensorflow Lite dynamic library and headers: Inference engine to run previously trained machine learning models.

--- a/buildroot-external/package/tensorflow-lite/tensorflow-lite.mk
+++ b/buildroot-external/package/tensorflow-lite/tensorflow-lite.mk
@ -24,7 +24,9 @@ TENSORFLOW_LITE_DEPENDENCIES += \
        libabseil-cpp \
        neon2sse \
        ruy \
-	xnnpack
+	xnnpack \
+	opencl_headers \
+	vulkan-headers

 TENSORFLOW_LITE_CONF_OPTS = \
 	-DCMAKE_C_FLAGS="$(TARGET_CFLAGS) -funsafe-math-optimizations \
@ -50,17 +52,25 @@ TENSORFLOW_LITE_CONF_OPTS = \
        -DFlatBuffers_DIR=$(STAGING_DIR)/usr/lib/cmake/flatbuffers \
        -DNEON_2_SSE_DIR=$(STAGING_DIR)/usr/lib/cmake/NEON_2_SSE \
        -DTFLITE_ENABLE_EXTERNAL_DELEGATE=ON \
-        -DTFLITE_ENABLE_GPU=OFF \
+        -DTFLITE_ENABLE_GPU=ON \
        -DTFLITE_ENABLE_INSTALL=ON \
        -DTFLITE_ENABLE_MMAP=ON \
        -DTFLITE_ENABLE_NNAPI=ON \
        -DTFLITE_ENABLE_RUY=ON \
        -DTFLITE_ENABLE_XNNPACK=ON

-TENSORFLOW_LITE_MAKE_OPTS += _pywrap_tensorflow_interpreter_wrapper
+TENSORFLOW_LITE_MAKE_OPTS += _pywrap_tensorflow_interpreter_wrapper benchmark_model
+
+TENSORFLOW_LITE_POST_INSTALL_STAGING_HOOKS = TENSORFLOW_LITE_INSTALL_VERSION_HEADER

 TENSORFLOW_LITE_POST_INSTALL_TARGET_HOOKS = TENSORFLOW_LITE_INSTALL_TFLITE_RUNTIME

+define TENSORFLOW_LITE_INSTALL_VERSION_HEADER
+	mkdir -p  $(STAGING_DIR)/usr/include/tensorflow/core/public
+	$(INSTALL) -D -m 644  $(@D)/tensorflow/core/public/version.h \
+		$(STAGING_DIR)/usr/include/tensorflow/core/public/
+endef
+
 define TENSORFLOW_LITE_INSTALL_TFLITE_RUNTIME

 	mkdir -p $(TARGET_DIR)/usr/lib/python$(PYTHON3_VERSION_MAJOR)/site-packages/tflite_runtime
--- a/buildroot-external/package/whisper-tflite/0002-Add-multithread-support.patch
+++ b/buildroot-external/package/whisper-tflite/0002-Add-multithread-support.patch
@ -1,25 +0,0 @@
-From 4aa7797f8f043df84104b76ceca423832824ea13 Mon Sep 17 00:00:00 2001
-From: j1nx <p.steenbergen@j1nx.nl>
-Date: Fri, 9 Dec 2022 20:25:46 +0100
-Subject: [PATCH 1/1] Add multithread support
-
---
- tflite_minimal/minimal.cc | 2 ++
- 1 file changed, 2 insertions(+)
-
-diff --git a/tflite_minimal/minimal.cc b/tflite_minimal/minimal.cc
-index cd045e0..82e9b11 100644
--- a/tflite_minimal/minimal.cc
-+++ b/tflite_minimal/minimal.cc
-@@ -200,6 +200,8 @@ int main(int argc, char* argv[]) {
-   else if (argc == 3) {
-     memcpy(input, mel.data.data(), mel.n_mel*mel.n_len*sizeof(float));
-   }
-+  interpreter->SetNumThreads(2);
-+
-   // Fill input buffers
-   // TODO(user): Insert code to fill input tensors.
-   // Note: The buffer of the input tensor with index `i` of type T can
-- 
-2.34.1
-
--- a/buildroot-external/package/whisper-tflite/0002-Use-4-threads.patch
+++ b/buildroot-external/package/whisper-tflite/0002-Use-4-threads.patch
@ -0,0 +1,24 @@
+From e2ebeaca6a16d981b0d130c06cfe38592623fbe3 Mon Sep 17 00:00:00 2001
+From: j1nx <p.steenbergen@j1nx.nl>
+Date: Fri, 20 Jan 2023 15:44:40 +0100
+Subject: [PATCH 1/1] Use 4 threads
+
+---
+ tflite_minimal/minimal.cc | 1 +
+ 1 file changed, 1 insertion(+)
+
+diff --git a/tflite_minimal/minimal.cc b/tflite_minimal/minimal.cc
+index cd045e0..88e21fe 100644
+--- a/tflite_minimal/minimal.cc
+++ b/tflite_minimal/minimal.cc
+@@ -186,6 +186,7 @@ int main(int argc, char* argv[]) {
+   tflite::InterpreterBuilder builder(*model, resolver);
+   std::unique_ptr<tflite::Interpreter> interpreter;
+   builder(&interpreter);
+  interpreter->SetNumThreads(4);
+   TFLITE_MINIMAL_CHECK(interpreter != nullptr);
+ 
+   // Allocate tensor buffers.
+-- 
+2.34.1
+
--- a/buildroot-external/package/whisper-tflite/0003-Multithread-support.patch
+++ b/buildroot-external/package/whisper-tflite/0003-Multithread-support.patch
@ -1,25 +0,0 @@
-From 624f7abc65cf1dee85d803c398b36a9b35106720 Mon Sep 17 00:00:00 2001
-From: j1nx <p.steenbergen@j1nx.nl>
-Date: Fri, 20 Jan 2023 14:22:23 +0100
-Subject: [PATCH 1/1] Multithread support
-
---
- tflite_minimal/minimal.cc | 2 ++
- 1 file changed, 2 insertions(+)
-
-diff --git a/tflite_minimal/minimal.cc b/tflite_minimal/minimal.cc
-index 82e9b11..e7d0187 100644
--- a/tflite_minimal/minimal.cc
-+++ b/tflite_minimal/minimal.cc
-@@ -186,6 +186,8 @@ int main(int argc, char* argv[]) {
-   tflite::InterpreterBuilder builder(*model, resolver);
-   std::unique_ptr<tflite::Interpreter> interpreter;
-   builder(&interpreter);
-+  const auto processor_count = std:: thread ::hardware_concurrency();
-+  interpreter->SetNumThreads(processor_count);
-   TFLITE_MINIMAL_CHECK(interpreter != nullptr);
- 
-   // Allocate tensor buffers.
-- 
-2.34.1
-
--- a/buildroot-patches/0023-Bump-libabseil-CXX-standard.patch
+++ b/buildroot-patches/0023-Bump-libabseil-CXX-standard.patch
@ -0,0 +1,31 @@
+From 6c4e6023d5b65447e23b737ebddff359668e64c4 Mon Sep 17 00:00:00 2001
+From: j1nx <p.steenbergen@j1nx.nl>
+Date: Wed, 25 Jan 2023 14:13:37 +0100
+Subject: [PATCH 1/1] Bump libabseil CXX standard
+
+---
+ package/libabseil-cpp/libabseil-cpp.mk | 4 ++--
+ 1 file changed, 2 insertions(+), 2 deletions(-)
+
+diff --git a/package/libabseil-cpp/libabseil-cpp.mk b/package/libabseil-cpp/libabseil-cpp.mk
+index 7c6bda7659..61ef26c11a 100644
+--- a/package/libabseil-cpp/libabseil-cpp.mk
+++ b/package/libabseil-cpp/libabseil-cpp.mk
+@@ -11,12 +11,12 @@ LIBABSEIL_CPP_LICENSE_FILES = LICENSE
+ LIBABSEIL_CPP_INSTALL_STAGING = YES
+ 
+ LIBABSEIL_CPP_CONF_OPTS = \
+-	-DCMAKE_CXX_STANDARD=11 \
+	-DCMAKE_CXX_STANDARD=17 \
+ 	-DABSL_ENABLE_INSTALL=ON \
+ 	-DABSL_USE_GOOGLETEST_HEAD=OFF
+ 
+ HOST_LIBABSEIL_CPP_CONF_OPTS = \
+-	-DCMAKE_CXX_STANDARD=11 \
+	-DCMAKE_CXX_STANDARD=17 \
+ 	-DABSL_ENABLE_INSTALL=ON \
+ 	-DABSL_USE_GOOGLETEST_HEAD=OFF
+ 
+-- 
+2.34.1
+
				`@ -0,0 +1 @@`
				`sha256 ca8090359654e94f2c41e946b7e9d826253d795ae809ce7c83a7d3c859624693 opencl_headers-dcd5bede6859d26833cd85f0d6bbcee7382dc9b3.tar.gz`