描述

本PR做出了一下两点更改:

  1. 为num_heads * num_levels * num_points <= 64的场景优化(优化40%)
  2. 修复可能由cast floor引起的bug(0.9999f -> 1)

关联的Issue

测试

文档更新

类型标签

  • Bug修复
  • 新特性
  • 性能优化
  • 文档更新
  • 其他,请描述: