// Copyright 2015 Citra Emulator Project // Licensed under GPLv2 or any later version // Refer to the license.txt file included. #pragma once #include #include #include "common/common_types.h" namespace Pica { /** * Template class for converting arbitrary Pica float types to IEEE 754 32-bit single-precision * floating point. * * When decoding, format is as follows: * - The first `M` bits are the mantissa * - The next `E` bits are the exponent * - The last bit is the sign bit * * @todo Verify on HW if this conversion is sufficiently accurate. */ template struct Float { public: static Float FromFloat32(float val) { Float ret; ret.value = val; return ret; } static Float FromRaw(u32 hex) { Float res; const int width = M + E + 1; const int bias = 128 - (1 << (E - 1)); const int exponent = (hex >> M) & ((1 << E) - 1); const unsigned mantissa = hex & ((1 << M) - 1); if (hex & ((1 << (width - 1)) - 1)) hex = ((hex >> (E + M)) << 31) | (mantissa << (23 - M)) | ((exponent + bias) << 23); else hex = ((hex >> (E + M)) << 31); std::memcpy(&res.value, &hex, sizeof(float)); return res; } static Float Zero() { return FromFloat32(0.f); } // Not recommended for anything but logging float ToFloat32() const { return value; } Float operator * (const Float& flt) const { if ((this->value == 0.f && !std::isnan(flt.value)) || (flt.value == 0.f && !std::isnan(this->value))) // PICA gives 0 instead of NaN when multiplying by inf return Zero(); return Float::FromFloat32(ToFloat32() * flt.ToFloat32()); } Float operator / (const Float& flt) const { return Float::FromFloat32(ToFloat32() / flt.ToFloat32()); } Float operator + (const Float& flt) const { return Float::FromFloat32(ToFloat32() + flt.ToFloat32()); } Float operator - (const Float& flt) const { return Float::FromFloat32(ToFloat32() - flt.ToFloat32()); } Float& operator *= (const Float& flt) { if ((this->value == 0.f && !std::isnan(flt.value)) || (flt.value == 0.f && !std::isnan(this->value))) // PICA gives 0 instead of NaN when multiplying by inf *this = Zero(); else value *= flt.ToFloat32(); return *this; } Float& operator /= (const Float& flt) { value /= flt.ToFloat32(); return *this; } Float& operator += (const Float& flt) { value += flt.ToFloat32(); return *this; } Float& operator -= (const Float& flt) { value -= flt.ToFloat32(); return *this; } Float operator - () const { return Float::FromFloat32(-ToFloat32()); } bool operator < (const Float& flt) const { return ToFloat32() < flt.ToFloat32(); } bool operator > (const Float& flt) const { return ToFloat32() > flt.ToFloat32(); } bool operator >= (const Float& flt) const { return ToFloat32() >= flt.ToFloat32(); } bool operator <= (const Float& flt) const { return ToFloat32() <= flt.ToFloat32(); } bool operator == (const Float& flt) const { return ToFloat32() == flt.ToFloat32(); } bool operator != (const Float& flt) const { return ToFloat32() != flt.ToFloat32(); } private: static const unsigned MASK = (1 << (M + E + 1)) - 1; static const unsigned MANTISSA_MASK = (1 << M) - 1; static const unsigned EXPONENT_MASK = (1 << E) - 1; // Stored as a regular float, merely for convenience // TODO: Perform proper arithmetic on this! float value; }; using float24 = Float<16, 7>; using float20 = Float<12, 7>; using float16 = Float<10, 5>; } // namespace Pica